博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
朴素贝叶斯知识点概括
阅读量:4637 次
发布时间:2019-06-09

本文共 708 字,大约阅读时间需要 2 分钟。

1. 简述

  贝叶斯是典型的生成学习方法

  对于给定的训练数据集,首先,基于特征条件独立假设,学习输入/输出的联合概率分布;然后,基于此模型,对于给定的输入x,根据贝叶斯定理后验概率最大的输出y

  术语说明:

  • 特征条件独立假设:用于分类的特征在类确定的条件下都是条件独立的。这一假设大大减少模型包含的条件概率数量,简化了贝叶斯方法的学习与预测
  • 联合概率分布:即先验概率和条件概率(条件独立性假设,重要知识点
  • 学习联合概率分布的方法:学习就是指估计先验概率和条件概率,具体方法有极大似然估计、贝叶斯估计(贝叶斯估计是为了避免极大似然估计出现概率为0的情况,影响计算)
  • 后验概率最大:等价于期望风险最小化

2 条件概率的估计

  摘自http://www.cnblogs.com/leoo2sk/archive/2010/09/17/naive-bayesian-classifier.html

  计算出各个划分的条件概率是朴素贝叶斯分类的关键,当特征是离散值时,统计出现频率即可,下面讨论连续值的情况

  当特征属性为连续值时,通常假定其值服从高斯分布(也称正态分布)。即:

      

      而

      因此只要计算出训练样本中各个类别中此特征项划分的各均值和标准差,代入上述公式即可得到需要的估计值

  代码:https://github.com/yundou2017/bayes/blob/master/Bayes2.m

优缺点

  • 优点:在数据较少的情况下仍然有效,可以处理多类别问题
  • 缺点:对于输入数据的准备方式较为敏感

转载于:https://www.cnblogs.com/xiaoyun94/p/6727404.html

你可能感兴趣的文章
LoadRunner常用术语
查看>>
关于jedis2.4以上版本的连接池配置,及工具类
查看>>
记忆讲师石伟华微信公众号2017所有文章汇总(待更新)
查看>>
mechanize (1)
查看>>
FactoryBean
查看>>
Coolite动态加载CheckboxGroup,无法在后台中获取
查看>>
如何在我们项目中利用开源的图表(js chart)
查看>>
nfs服务器工作原理
查看>>
C3P0连接池工具类使用
查看>>
SVN常用命令备注
查看>>
孩子教育
查看>>
解决Cacti监控图像断断续续问题
查看>>
结构体的传参理解成员的存储方式
查看>>
python 进程与线程(理论部分)
查看>>
什么是API
查看>>
Java反射中method.isBridge() 桥接方法
查看>>
[shiro学习笔记]第二节 shiro与web融合实现一个简单的授权认证
查看>>
强名称程序集(strong name assembly)——为程序集赋予强名称
查看>>
1028. List Sorting (25)
查看>>
BZOJ 1613: [Usaco2007 Jan]Running贝茜的晨练计划
查看>>