python垃圾邮件识别_Python之机器学习-朴素贝叶斯(垃圾邮件分类)

350 阅读 0 评论 231 点赞

我是靠谱客的博主矮小小蝴蝶，这篇文章主要介绍python垃圾邮件识别_Python之机器学习-朴素贝叶斯(垃圾邮件分类)，现在分享给大家，希望可以做个参考。

朴素贝叶斯(垃圾邮件分类)

邮箱训练集下载地址

邮箱训练集可以加我微信：chenyoudea

模块导入

import re

import os

from jieba import cut

from itertools import chain

from collections import Counter

import numpy as np

from sklearn.naive_bayes import MultinomialNB

文本预处理

def get_words(filename):

"""读取文本并过滤无效字符和长度为1的词"""

words = []

with open(filename, 'r', encoding='utf-8') as fr:

for line in fr:

line = line.strip()

# 过滤无效字符

line = re.sub(r'[.【】0-9、——。，！~*]', '', line)

# 使用jieba.cut()方法对文本切词处理

line = cut(line)

# 过滤长度为1的词

line = filter(lambda word: len(word) > 1, line)

words.extend(line)

return words

遍历邮件

all_words = []

def get_top_words(top_num

最后

以上就是矮小小蝴蝶最近收集整理的关于python垃圾邮件识别_Python之机器学习-朴素贝叶斯(垃圾邮件分类)的全部内容，更多相关python垃圾邮件识别_Python之机器学习-朴素贝叶斯(垃圾邮件分类)内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。

点赞(231)

本文分类：python垃圾邮件识别
浏览次数：350 次浏览
发布日期：2023-10-21 19:46:21

相关文章

java集合框架图

Jenkins高级篇之Pipeline语法篇-5-Declarative Pipeline语法-post/stages/steps

Jenkins高级篇之Pipeline语法篇-5-Declarative Pipeline语法-post/stages/steps

Java面向对象有哪些特征？

jenkins + pipeline构建自动化部署(转)jenkins + pipeline构建自动化部署

jenkins + pipeline构建自动化部署(转)jenkins + pipeline构建自动化部署

python垃圾邮件识别_Python之机器学习-朴素贝叶斯(垃圾邮件分类)

python垃圾邮件识别_Python之机器学习-朴素贝叶斯(垃圾邮件分类)

Java基础知识第三讲：深入集合类（常用的集合类有哪些？比如List如何排序？集合的安全？）深入集合类（常用的集合类有哪些/比如List如何排序/集合的安全）

Java基础知识第三讲：深入集合类（常用的集合类有哪些？比如List如何排序？集合的安全？）深入集合类（常用的集合类有哪些/比如List如何排序/集合的安全）

Flink 1.13 源码解析——Graph的转化以及JobGraph的构建前言概述Flink JobGraph的构建总结

Flink 1.13 源码解析——Graph的转化以及JobGraph的构建前言概述Flink JobGraph的构建总结

Jenkins在脚本式 pipeline中等效申明式pipeline中 post的写法

Jenkins在脚本式 pipeline中等效申明式pipeline中 post的写法

评论列表共有 0 条评论

发表评论取消回复

立即
投稿返回
顶部