我是靠谱客的博主 无情枫叶,最近开发中收集的这篇文章主要介绍python情感词典计算得分_基于情感词典的情感打分,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

原理我就不讲了,请移步下面这篇论文,包括情感词典的构建(各位读者可以根据自己的需求稍作简化),以及打分策略(程序对原论文稍有改动)。

论文在这里下载:基于情感词典的中文微博情感倾向性研究

(大家可以上知网自行下载)

本文采用的方法如下:

 

首先对单条微博进行文本预处理,并以标点符号为分割标志,将单条微博分割为n个句子,提取每个句子中的情感词 。以下两步的处理均以分句为处理单位。

第二步在情感词表中寻找情感词,以每个情感词为基准,向前依次寻找程度副词、否定词,并作相应分值计算。随后对分句中每个情感词的得分作求和运算。

第三步判断该句是否为感叹句,是否为反问句,以及是否存在表情符号。如果是,则分句在原有分值的基础上加上或减去对应的权值。

最后对该条微博的所有分句的分值进行累加,获得该条微博的最终得分。

代码如下:

首先文件结构图如下:

其中,degree_dict为程度词典,其中每个文件为不同的权值。

emotion_dict为情感词典,包括了积极情感词和消极情感词以及停用词。

文件一:文本预处理 textprocess.py

在里面封装了一些文本预处理的函数,方便调用。

# -*- coding: utf-8 -*-

__author__ = 'Bai Chenjia'

import jieba

<

最后

以上就是无情枫叶为你收集整理的python情感词典计算得分_基于情感词典的情感打分的全部内容,希望文章能够帮你解决python情感词典计算得分_基于情感词典的情感打分所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(56)

评论列表共有 0 条评论

立即
投稿
返回
顶部