分词并去停用词自定义函数：seg_word(sentence)

51 阅读 0 评论 34 点赞

我是靠谱客的博主淡定往事，最近开发中收集的这篇文章主要介绍分词并去停用词自定义函数：seg_word(sentence)，觉得挺不错的，现在分享给大家，希望可以做个参考。

概述

分词并去停用词自定义函数：seg_word(sentence)。

import jieba
def seg_word(sentence):
    """使用jieba对文档分词"""
    seg_list = jieba.cut(sentence)
    # 读取停用词文件
    stopword_list = [k.strip() for k in open('stopwords.txt', encoding='utf8').readlines() if k.strip() != '']
    # 去除停用词
    return list(filter(lambda x: x not in stopword_list, seg_list))
print(seg_word("今天是开心的一天"))

输入一个句子"今天是开心的一天"，函数返回值为：[‘今天’, ‘开心’, ‘一天’]。

最后

以上就是淡定往事为你收集整理的分词并去停用词自定义函数：seg_word(sentence)的全部内容，希望文章能够帮你解决分词并去停用词自定义函数：seg_word(sentence)所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错，欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。

点赞(34)

本文分类：毕业论文相关
浏览次数：51 次浏览
发布日期：2024-08-08 10:10:01
本文链接：https://www.kaopuke.com/article/k-p-k_13_u_7_o_18_f4_13_j_22_0.html

相关文章

Python—基于情感词典的情感分析

Python—基于情感词典的情感分析

基于情感词典的文本情感分析

python分词代码_python jieba 分词进阶

python分词代码_python jieba 分词进阶

大数据毕设选题 - 京东消费数据分析与可视化（python 大数据机器学习）1 前言2 数据处理3 数据分析4 产品数据分析5 建立回归模型6 最后

大数据毕设选题 - 京东消费数据分析与可视化（python 大数据机器学习）1 前言2 数据处理3 数据分析4 产品数据分析5 建立回归模型6 最后

分词并去停用词自定义函数：seg_word(sentence)

分词并去停用词自定义函数：seg_word(sentence)

pytorch nlp分类模型训练过程

pytorch nlp分类模型训练过程

京东商品评论分析(爬虫+分词+词云图)

京东商品评论分析(爬虫+分词+词云图)

2021泰迪杯-数据挖掘练习1-京东热水器评论分析本次挖掘目标

2021泰迪杯-数据挖掘练习1-京东热水器评论分析本次挖掘目标

评论列表共有 0 条评论

发表评论取消回复

立即
投稿返回
顶部