概述
原理我就不讲了,请移步下面这篇论文,包括情感词典的构建(各位读者可以根据自己的需求稍作简化),以及打分策略(程序对原论文稍有改动)。
论文在这里下载:基于情感词典的中文微博情感倾向性研究
(大家可以上知网自行下载)
本文采用的方法如下:
首先对单条微博进行文本预处理,并以标点符号为分割标志,将单条微博分割为n个句子,提取每个句子中的情感词 。以下两步的处理均以分句为处理单位。
第二步在情感词表中寻找情感词,以每个情感词为基准,向前依次寻找程度副词、否定词,并作相应分值计算。随后对分句中每个情感词的得分作求和运算。
第三步判断该句是否为感叹句,是否为反问句,以及是否存在表情符号。如果是,则分句在原有分值的基础上加上或减去对应的权值。
最后对该条微博的所有分句的分值进行累加,获得该条微博的最终得分。
代码如下:
首先文件结构图如下:
其中,degree_dict为程度词典,其中每个文件为不同的权值。
emotion_dict为情感词典,包括了积极情感词和消极情感词以及停用词。
文件一:文本预处理 textprocess.py
在里面封装了一些文本预处理的函数,方便调用。
# -*- coding: utf-8 -*-
__author__ = 'Bai Chenjia'
import jieba
<最后
以上就是无情枫叶为你收集整理的python情感词典计算得分_基于情感词典的情感打分的全部内容,希望文章能够帮你解决python情感词典计算得分_基于情感词典的情感打分所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复