使用jieba所遇到的bug

169 阅读 0 评论 112 点赞

我是靠谱客的博主留胡子发带，这篇文章主要介绍使用jieba所遇到的bug，现在分享给大家，希望可以做个参考。

1.在spark与结巴结合使用时，在主节点load一次字典，该字典只存在于spark的driver里面，但是worker进程无法共享这段内存，会导致分词时字典没用上，解决方法，在每个mapPartitions函数里添加jieba字典标识位（jieba.dt.initialized）：

if not jieba.dt.initialized:
    jieba.load_userdict('user_dict.txt')

2.jiaba的字典也可以直接传入set形式，因其源码书写并不规范化：

3.repr()函数的作用是将dict或set等形式转为string

最后

以上就是留胡子发带最近收集整理的关于使用jieba所遇到的bug的全部内容，更多相关使用jieba所遇到内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。

点赞(112)

本文分类：自然语言处理
浏览次数：169 次浏览
发布日期：2024-08-07 16:20:02
本文链接：https://www.kaopuke.com/article/k-p-k_13_u_7_o_18_f4_13__23__26_w.html

相关文章

jieba textrank关键词提取 python_Jieba库基本用法

jieba textrank关键词提取 python_Jieba库基本用法

特征提取初识特征提取初识

Python中jieba分词自定义字典失效？

Python中jieba分词自定义字典失效？

python jieba分词，一次性添加多个词

python jieba分词，一次性添加多个词

使用jieba所遇到的bug

jieba分词（添加分词词典）

jieba分词（添加分词词典）

python 获取qq群成员信息_用Python编写工具获取QQ群成员的昵称和号码,使用,及,小...

python 获取qq群成员信息_用Python编写工具获取QQ群成员的昵称和号码,使用,及,小...

更新pip库时出现了name 'w' is not defined应该如何解决？

更新pip库时出现了name 'w' is not defined应该如何解决？

评论列表共有 0 条评论

发表评论取消回复

立即
投稿返回
顶部