【NLP】文本处理基础操作:停用词,去掉杂乱的词(用nltk),pandas遍历和存储成为txt文件程序代码以及说明遍历dataframe完成去掉杂乱词和小写pandas存为文件用dropna去除不想要的数据的小技巧
【NLP】文本处理基础操作:停用词,去掉杂乱的词(用nltk),pandas遍历和存储成为文件文章目录程序代码以及说明遍历dataframe完成去掉杂乱词和小写pandas存为文件用dropna去除不想要的数据的小技巧程序代码以及说明利用这段程序完成了把一个csv第一行是情感,第二行是评论的数据去掉乱七八糟的字符和完成小写之后,存到了一个txt文件里面当然整体的程序可能不是很重要重要的是里面处理的步骤和特定的语法下面拆开来讲import pandas as pdimport numpy as