情感分析学习笔记-Task01
Task01,由于我们要弄清楚情感分析的大概流程,所以我们用最简单的模型来理解,我们使用IMDB数据集(IMDb数据集包含50000条电影评论,每条评论都标记为正面或负面评论)下面就边上代码边理解。这里面en_core_web_sm是一个NLP的语言模型,spaCy使用的语言模型是预先训练的统计模型,能够预测语言特征,对于英语,共有en_core_web_sm、en_core_web_md和en_core_web_lg三种语言模型,sm/md/lg为描述大小的缩写:small(小)、medium