2019独角兽企业重金招聘Python工程师标准>>> 
##关键词提取技术
-
TF(词频)-IDF(逆文档频率)
http://www.ruanyifeng.com/blog/2013/03/tf-idf.html
-
中文分词
工具对比
https://my.oschina.net/apdplat/blog/412921分词方案 https://www.zhihu.com/question/19578687
-
分析非结构化内容(比如文本、视频和音频)框架 uima
-
淘宝的评论归纳
https://www.zhihu.com/question/20905103
-
同义名词和形容词的合并
可选分方法比较多,使用相关系数计算两个词之间的相似度,或者使用SimRank,或者使用word2vec,我采用的第一种,简单关键是效果不错。其实,形容词的相似是有词典可以用的,但是直接用肯定是不行的。
- Latent Semantic Analysis
转载于:https://my.oschina.net/u/2307114/blog/833491
最后
以上就是痴情蜜蜂最近收集整理的关于关键词提取调研的全部内容,更多相关关键词提取调研内容请搜索靠谱客的其他文章。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复