目前平台处于试运行阶段,如有任何问题或建议,请发送邮件至 service@dataju.cn 或加入QQ群 565136792 联系管理员。

满足不同角色需求:领域专家 数据管理者 数据科学家 科研人员、高校教师及研究生 数据分析爱好者
Simple Naive Bayes 分类方法
1095次浏览 dataju 于 2016-07-10 发布
该内容是由用户自发提供,聚数力平台仅提供平台,让大数据应用过程中的信息实现共享、交易与托管。如该内容涉及到您的隐私或可能侵犯版权,请告知我们及时删除。
分析方法描述
Simple Naive Bayes Classifier即简单朴素贝叶斯分类器,是Naive Bayes Classifier(朴素贝叶斯分类器)的一种。其构建分类器的思想是,在各个属性互相之间两两独立的假设前提下,运用贝叶斯定理构建统计分类器。 给定训练样本($\textbf{x}={x_1,x_2,...,x_n}$),分类问题是判断概率$p(C_k|\textbf{x})=p(C_k|x_1,x_2,...,x_n)$。根据贝叶斯定理, \begin{equation} \begin{split} \label{svmTotal} P(C_k|\textbf{x})= \frac{p(C_k, \textbf{x})}{p(\textbf{x})} = \frac{p(C_k)p(\textbf{x}|C_k)}{p(\textbf{x})} \\ \end{split} \end{equation} \begin{equation} \begin{split} p(C_k,\textbf{x}) &= p(C_k)p(x_1,x_2,...,x_n|C_k) \\ &= p(C_k)p(x_1|C_k)p(x_2,x_3,...,x_n|C_k,x_1) \\ &= p(C_k)p(x_1|C_k)p(x_2|C_k,x_1,x_2)p(x_3,x_4,...x_n|C_k,x_1,x_2) \\ &= p(C_k)p(x_1|C_k)p(x_2|C_k,x_1,x_2)...p(x_n|C_k,x_1,x_2,...x_{n-1}) \end{split} \end{equation} 由于各属性之间两两独立,有以下等式存在 \begin{align} & p(\textbf{x})=p(x_1,x_2,...,x_n)=p(x_1)p(x_2)...p(x_n) \\ & p(x_i|C_k,x_j)=p(x_i|C_k)\\ & p(x_i|C_k,x_j,x_q)=p(x_i|C_k)\\ & p(x_i|C_k,x_j,x_q,x_s)=p(x_i|C_k) \end{align} 因此, \begin{align} p(C_k|\textbf{x}) & = \frac{p(C_k,\textbf{x})}{p(\textbf{x})} \\ & = \frac{ p(C_k)p(x_1|C_k)p(x_2|C_k,x_1)...p(x_n|C_k,x_1,x_2,..x_{n-1})}{p(x_1)p(x_2)...p(x_n)} \\ & = \frac{ p(C_k) \prod_{i=1}^{n}{p(x_i|C_k)} }{p(x_1)p(x_2)...p(x_n)} \end{align}
分析方法参数
暂无
相关应用案例
# 应用案例名称 应用案例介绍
1 UCI Germny数据集 Native Bayes 建模预测贷款违约 UCI Germny数据集 Native Bayes 建模预测贷款违约
参考资料
暂无

目前平台处于试运行阶段,如有任何问题或建议,请发送邮件至 service@dataju.cn 或加入QQ群 565136792 联系管理员。