理论知识
朴素贝叶斯
背诵记忆
概念: 基于贝叶斯定理的概率分类算法,适用于文本分类、垃圾邮件过滤、感情分析等任务,底层原理是通过贝叶斯公式中的条件概率和全概率公式等来预测标签分类。
朴素:假设所有的特征之间都相互独立,在真实场景下,特征之间是相互之间具备联系的,之所以这样所得好处是简化了计算,效果通常不错。
分类: 根据预测标签数据分布不同,划分为三种不同的算法3种,当标签预估分布成正态分布时用高斯朴素贝叶斯,比如身高体重等;当标签预测预估成次数或者次数比例时,使用多项式朴素贝叶斯,当标签预测是二分类问题时,可以选用伯努利朴素贝叶斯
问题: 通过拉普拉斯平滑解决0概率问题