原标题:用Python对哈利波特系列小说进行情感分析
准备数据
现有的数据是一部小说放在一个txt里,我们想按照章节(列表中第一个就是章节1的内容,列表中第二个是章节2的内容)进行分析,这就需要用到正则表达式整理数据。
比如我们先看看 01-Harry Potter and the Sorcerer's Stone.txt" 里的章节情况,我们打开txt
经过检索发现,所有章节存在规律性表达
[Chapter][空格][整数][换行符n][可能含有空格的英文标题][换行符n]
我们先熟悉下正则,使用这个设计一个模板pattern提取章节信息
import re
import nltk
raw_text = open("data/01-Harry Potter and the Sorcerer's Stone.txt").read
pattern = 'Chapter d+n[a-zA-Z ]+n'
re.findall(pattern, raw_text)
['Chapter 1nThe Boy Who Livedn',
'Chapter 2nThe Vanishing Glassn',
'Chapter 3nThe Letters From No Onen',
'Chapter 4nThe Keeper Of The Keysn',
'Chapter 5nDiagon Alleyn',
'Chapter 7nThe Sorting Ha
最后
以上就是重要荷花最近收集整理的关于用python分析小说_用Python对哈利波特系列小说进行情感分析的全部内容,更多相关用python分析小说_用Python对哈利波特系列小说进行情感分析内容请搜索靠谱客的其他文章。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复