概述
原标题:长文干货 | 基于豆瓣影评数据的完整文本分析!
作者:沂水寒城,CSDN博客专家,个人研究方向:机器学习、深度学习、NLP、CV
Blog: http://yishuihancheng.blog.csdn.net
文本分析中很多的工作都是基于评论数据来进行的,比如:滴滴出行的评价数据、租房的评价数据、电影的评论数据等等,从这些预料数据中能够挖掘出来客户群体对于某种事物或者事情的看法,较为常见的工作有:舆情分析、热点挖掘和情感分析。
在之前的工作经历中,我对微博数据和电影评论数据进行文本分析工作较多,今天的文章主要就是想以影评数据为切入点介绍一些自己文本分析的流程和方法,本文简单的实现流程如下图所示:
主要分为:数据采集、数据清洗存储、主题挖掘、分词与词频统计、词云展示几个部分。
一、影评数据采集
影评数据有很多网站可以去获取,比如最常用的猫眼电影、豆瓣电影等等,本文是基于豆瓣电影完成的数据采集工作,这个具体的采集项目网上都有很多详细的讲解与实现,这里我就不再对采集过程进行过多的介绍,直接看代码实现。
首选需要实现对于给定电影名称获取到其对应的id功能,因为在数据中电影数据项都是以id作为标识的,这里的代码实现很简单,主要是就是需要找到具体请求的API即可:
defgetIMDBIdByName(name='勇敢的心',save_path='id_title.txt'):
'''''
最后
以上就是勤奋魔镜为你收集整理的基于python的智能文本分析 豆瓣_长文干货 | 基于豆瓣影评数据的完整文本分析!...的全部内容,希望文章能够帮你解决基于python的智能文本分析 豆瓣_长文干货 | 基于豆瓣影评数据的完整文本分析!...所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复