冷傲星星

文章
8
资源
0
加入时间
3年0月8天

如何高效剔除jieba分词中的标点符号和其他特殊字符

关于分词有两个令人头痛的问题:一个是常用词,一个是标点符号。如果使用jieba分词的,那么这两种‘符号’都会混杂在我们的结果中。常用词可以使用停用词字典。而标点符号可以使用正则剔除,具体如下:...text = re.sub('\W*', '', file.readlines())word_list = jieba.cut(text)...注:如果文件很大时,建议按行读取,逐行分词。...

学生信息管理系统(链表)

#include<stdio.h>#include<stdlib.h>#include<string.h>struct stud_node{int num;char name[20];int math,score,engli

sql server触发器写法

文章目录###参考资料:https://social.msdn.microsoft.com/Forums/sqlserver/en-US/06d19955-5041-4f58-86f6-b5f1ada8b0d8/how-to-get-old-and-new-values-while-writing-triggers-in-sql-server-2005-or-2008?forum=trans...