我是靠谱客的博主 过时小懒猪,这篇文章主要介绍python中文读_python读取中文,现在分享给大家,希望可以做个参考。

如何从文件中读取300个汉字?

看起来很简单,但很容易掉坑里了。

一开始我这么写:

try:

fd = codecs.open(os.path.join(settings.TEXT_CONTENT_DIR,channel_name.lower(), article_id), encoding='utf-8')

#fd = open(os.path.join(settings.TEXT_CONTENT_DIR,channel_name.lower(), article_id))

text = fd.read(300)

fd.close()

except Exception, e:

print "content.load() Error:", e

但是文件中如果是中英文夹杂怎么办?

因为 utf8编码是变长的,所以很有可能会读出半个汉字。

解决办法:

1.写文件时指定 utf8编码:

import codecs

fd = codecs.open(conf.data_directory + os.sep + conf.text_directory + os.sep + channel_name + os.sep + str(id),

'w+', "utf-8")

fd.write(text)

fd.close()

http://segmentfault.com/q/1010000000131965

2.指定 utf8读文件:

try:

fd 

最后

以上就是过时小懒猪最近收集整理的关于python中文读_python读取中文的全部内容,更多相关python中文读_python读取中文内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(133)

评论列表共有 0 条评论

立即
投稿
返回
顶部