概述
原标题:用Python对哈利波特系列小说进行情感分析
准备数据
现有的数据是一部小说放在一个txt里,我们想按照章节(列表中第一个就是章节1的内容,列表中第二个是章节2的内容)进行分析,这就需要用到正则表达式整理数据。
比如我们先看看 01-Harry Potter and the Sorcerer's Stone.txt" 里的章节情况,我们打开txt
经过检索发现,所有章节存在规律性表达
[Chapter][空格][整数][换行符n][可能含有空格的英文标题][换行符n]
我们先熟悉下正则,使用这个设计一个模板pattern提取章节信息
import re
import nltk
raw_text = open("data/01-Harry Potter and the Sorcerer's Stone.txt").read
pattern = 'Chapter d+n[a-zA-Z ]+n'
re.findall(pattern, raw_text)
['Chapter 1nThe Boy Who Livedn',
'Chapter 2nThe Vanishing Glassn',
'Chapter 3nThe Letters From No Onen',
'Chapter 4nThe Keeper Of The Keysn',
'Chapter 5nDiagon Alleyn',
'Chapter 7nThe Sorting Ha
最后
以上就是重要荷花为你收集整理的用python分析小说_用Python对哈利波特系列小说进行情感分析的全部内容,希望文章能够帮你解决用python分析小说_用Python对哈利波特系列小说进行情感分析所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复