概述
研究目的及意义
研究意义:
互联网+时代的到来,互联网飞速发展,从互联网获取信息已经成为人们获取信息的主要手段,电商交易的迅猛增加。所以对于消费者及企业意义重大。
企业:了解产品优点并转化为卖点,了解产品缺点并进行改进,知道消费者关注产品的哪一方面并进行后续优化升级。
消费者:多方面多角度的了解该产品的各方面信息,从而判断产品质量。
研究目的:
增加商品评论情感分析的准确度。。。。
国内外研究现状
国外:
huettner:创建了可以同时表示情感词的强度以及词与类别的关联度的情感极性辞典(向心度表示关联度)
pang:n-gram作为词语特征和词性特征,分别用最大熵模型、朴素贝叶斯和SVM(支持向量机)三种机器学习的方法进行情感分类研究
J.KAMPS:用wordnet判断指定词和基准词是否为同义词来判断指定词的极性
国内:
刘群:借助知网的词语树结构中的语义距离计算词语相似度,从而判断情感倾向,并提出基于hownet的词汇语义相似度计算方法。
唐慧丰:发现在训练样本足够多并且特征词的数量合适的情况下,选用
表示样本集特征、选用信息增益作为特征选择方法和选取支持向量机方法进行分类,这样获得的情感分类模型会体现出较好的分类性能。
赵妍研:将文本情感分析分为三个阶段,情感信息抽取、情感信息分类、情感信息检索与归纳。还通过分析句法结构提出评价对象与修饰词之间的评价搭配关系并提出一种基于句法路径的情感评价单元自动识别方法。
文本情感分类的研究现状:
1.基于情感知识的分类:利用hownet等建立极性词典,局限于形容词,忽略了文本的上下文信息。
2.基于特征选择的情感分类:SVM分类效果最好,特征选择中unigrams表现最佳。
产品特征提取研究现状:
人工:构建三元组,<产品,特征,对特征的态度>,无法大规模使用
自动提取:用词性标注,句法分析等技术对评论进行与句法分析
分为显性特征和隐形特征(这款手机便于携带)。
liu和hu:监督的方法提取产品特征,先人工标注数据集作为训练集,抽取包括3-GRAM的评论句语段。然后利用关联规则挖掘相关规则,再利用这些规则提取产品信息。
观点词提取现状:监督的学习方法;属性名词最近的形容词
weka 数据堂 八爪鱼 SVM
最后
以上就是无私戒指为你收集整理的论文开题报告研究目的及意义国内外研究现状的全部内容,希望文章能够帮你解决论文开题报告研究目的及意义国内外研究现状所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复