我是靠谱客的博主 过时小懒猪,最近开发中收集的这篇文章主要介绍python中文读_python读取中文,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

如何从文件中读取300个汉字?

看起来很简单,但很容易掉坑里了。

一开始我这么写:

try:

fd = codecs.open(os.path.join(settings.TEXT_CONTENT_DIR,channel_name.lower(), article_id), encoding='utf-8')

#fd = open(os.path.join(settings.TEXT_CONTENT_DIR,channel_name.lower(), article_id))

text = fd.read(300)

fd.close()

except Exception, e:

print "content.load() Error:", e

但是文件中如果是中英文夹杂怎么办?

因为 utf8编码是变长的,所以很有可能会读出半个汉字。

解决办法:

1.写文件时指定 utf8编码:

import codecs

fd = codecs.open(conf.data_directory + os.sep + conf.text_directory + os.sep + channel_name + os.sep + str(id),

'w+', "utf-8")

fd.write(text)

fd.close()

http://segmentfault.com/q/1010000000131965

2.指定 utf8读文件:

try:

fd 

最后

以上就是过时小懒猪为你收集整理的python中文读_python读取中文的全部内容,希望文章能够帮你解决python中文读_python读取中文所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(47)

评论列表共有 0 条评论

立即
投稿
返回
顶部