浅尝辄止

理论是灰色的,而生命之树常青。这里是@Dilettante258 的个人博客,用于记载和分享学习。

垃圾邮件过滤器、朴素贝叶斯与数据清理

Dilettante258's avatar
| 0 views

朴素贝叶斯模型

贝叶斯法则

贝叶斯法则可能是概率论中最有生命力的一个公式。它可以用来计算条件概率或者主观概率。
贝叶斯法则的思想非常简单:随机事件发生的概率随着相关条件的发生而改变,一个命题真假的信念即主观概率随着相关证据的发现而改变。当正相关条件发生时,条件概率上调,当负相关条件发生时,条件概率下调。当有利证据发现时,主观概率上调,当不利证据发现时,主观概率下调。 个检测技术有99%的正确率,发病率1%,但是对于一个被测阳性的人来说仍然有50%的概率未患病。说明一个事件发生的先验概率很低,那么即使出现了非常有力的证据,这个事件发生的后验概率也不一定会很高。 在实际应用贝叶斯法则的时候,通常会存在许多的条件,而不是单个条件。例如利用关键词判断垃圾邮件。