python中文读_python读取中文

306 阅读 0 评论 202 点赞

我是靠谱客的博主过时小懒猪，这篇文章主要介绍python中文读_python读取中文，现在分享给大家，希望可以做个参考。

如何从文件中读取300个汉字？

看起来很简单，但很容易掉坑里了。

一开始我这么写：

try:

fd = codecs.open(os.path.join(settings.TEXT_CONTENT_DIR,channel_name.lower(), article_id), encoding='utf-8')

#fd = open(os.path.join(settings.TEXT_CONTENT_DIR,channel_name.lower(), article_id))

text = fd.read(300)

fd.close()

except Exception, e:

print "content.load() Error:", e

但是文件中如果是中英文夹杂怎么办？

因为 utf8编码是变长的，所以很有可能会读出半个汉字。

解决办法：

1.写文件时指定 utf8编码：

import codecs

fd = codecs.open(conf.data_directory + os.sep + conf.text_directory + os.sep + channel_name + os.sep + str(id),

'w+', "utf-8")

fd.write(text)

fd.close()

http://segmentfault.com/q/1010000000131965

2.指定 utf8读文件：

try:

以上就是过时小懒猪最近收集整理的关于python中文读_python读取中文的全部内容，更多相关python中文读_python读取中文内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。