自然语言处理小案例:基于文本内容的垃圾短信分类
案例目标:识别垃圾短信基于短信文本内容,建立识别模型,准确识别出垃圾短信,以及垃圾短信过滤的问题一、数据获取1、数据读取data = pd.read_csv('fileName', header=None, index_col=0) #读取数据data.columns = ['label', 'message']2、数据抽取n = 5000 # 设置抽取5000条测试数据a = data[data['label'] == 0].sample(n) # 正常短信0