贝叶斯之垃圾邮件分类
贝叶斯垃圾邮件过滤:问题:给定一封邮件,判定它是否属于垃圾邮件D来表示这封邮件,注意D由N个单词组成。我们用h+来表示垃圾邮件,h-表示正常邮件P(h+|D)=P(h+) * P(D|h+)/P(D)P(h-|D)=P(h-) * P(D|h-)/P(D)注释:P(h+|D)和P(h-|D)分别表示这份邮件是垃圾邮件和正常邮件的概率;这些D单词分别在垃圾邮件和正常邮件中出现的概率P(D|h-)和P(D|h+);P(h+)和P(h-)表示先验概率(1000份样本邮件中垃圾邮件和正常邮.