概述
2019独角兽企业重金招聘Python工程师标准>>>
##关键词提取技术
-
TF(词频)-IDF(逆文档频率)
http://www.ruanyifeng.com/blog/2013/03/tf-idf.html
-
中文分词
工具对比
https://my.oschina.net/apdplat/blog/412921分词方案 https://www.zhihu.com/question/19578687
-
分析非结构化内容(比如文本、视频和音频)框架 uima
-
淘宝的评论归纳
https://www.zhihu.com/question/20905103
-
同义名词和形容词的合并
可选分方法比较多,使用相关系数计算两个词之间的相似度,或者使用SimRank,或者使用word2vec,我采用的第一种,简单关键是效果不错。其实,形容词的相似是有词典可以用的,但是直接用肯定是不行的。
- Latent Semantic Analysis
转载于:https://my.oschina.net/u/2307114/blog/833491
最后
以上就是痴情蜜蜂为你收集整理的关键词提取调研的全部内容,希望文章能够帮你解决关键词提取调研所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复