缓慢玉米

文章
5
资源
0
加入时间
3年1月12天

Python文本分类(不涉及算法)

Python文本分类**首先下载安装,用到的库有pandas和jieba库这个文本分类很简单,并不涉及算法**源数据是二个excel文件,大约7000条数据,首先把二个文件进行合并成一个DF,这里我用的是pandas,就是把二个文件合并成一个文件,方便后面输入读入。再把文章标题和文章内容合并到一个新列中,我命名为text的列,然后再读取text列数据,按照每行读取一篇文章进行分词,并且统计词语的频率数。然后再根据排序获得词频最高的8个词语,然后把他们存到列表元组中,后面会用到。得到每一篇文