目前平台处于试运行阶段,如有任何问题或建议,请发送邮件至 service@dataju.cn 或加入QQ群 565136792 联系管理员。

满足不同角色需求:领域专家 数据管理者 数据科学家 科研人员、高校教师及研究生 数据分析爱好者
高斯径向核函数C-SVC分类方法
1556次浏览 dataju 于 2016-07-10 发布
该内容是由用户自发提供,聚数力平台仅提供平台,让大数据应用过程中的信息实现共享、交易与托管。如该内容涉及到您的隐私或可能侵犯版权,请告知我们及时删除。
分析方法描述
RBF核函数C-SVC模型,是采用线性核函数的C-SVC模型。C-SVC模型是支持向量机模型(Support Vector Machine)的一种,针对有监督学习(Supervised Learning)中的二分类(Binary Classification)问题。为了解决线性核函数无法处理线性不可分的情形,引入函数$\Phi( )$对将原始空间映射到高维空间,以使数据在高维空间得以划分,如公式\eqref{equ:kernalFun}。 $$ \begin{equation} \begin{split} &~~ R^n \rightarrow \mathscr{ H } \\ &~~ x \rightarrow \Phi (x) \end{split} \label{equ:kernalFun} \end{equation} $$ 对应求解最优化问题的原始问题为: $$ \begin{equation} \begin{split} \min & \quad \frac{1}{2} w^Tw + C \sum_{i=1}^{n} { \xi_i } \\ s.t. & \quad y_i (w^T \cdot \Phi( x_i ) + b) \geq 1 - \xi_i, \\ & \quad \xi_i \geq 0. \end{split} \label{equ:svmOriginal} \end{equation} $$ 其中,建模对象数量为$n$,每个建模实例为$x_i$。最终的决策函数为 $ f(x) = w^T \cdot \Phi( x ) +b $。由于函数$\Phi(x)$ 并非预先给定,这里就需要用到SVM中的小技巧,将原始问题\eqref{equ:svmOriginal}转化为其对偶问题,对偶问题的形式为: \begin{equation} \begin{split} \min_{\alpha} & \quad \frac{1}{2} \sum_{i=1}^{n} \sum_{i=1}^{n} y_i y_j ( \Phi(x_i) \cdot \Phi(x_j) ) \alpha_i \alpha_j - \sum_{i=1}^{n} \alpha_j \\ s.t. & \quad \sum_{i=1}^{n} y_i \alpha_i = 0, \\ & \quad 0 \leq \alpha_i \leq C, i=1,2,..,n. \end{split} \label{equ:svmNonlinDual} \end{equation} 其中,建模对象数量为$n$,$\alpha_i$为原始问题不等式约束所对应的拉格朗日乘子。更重要的是,公式\eqref{equ:svmNonlinDual}中的$\Phi(x_i) \cdot \Phi(x_j)$就可使用核函数$K(x_i,x_j)$来代替。相应的决策函数变为$f(x)=$ 当选取RBF核函数时, $$ K( x_i, x_j ) = \exp( -\frac{\|x_i-x_j\|^2}{2\sigma^2} ) $$
分析方法参数
# 名称 描述
1 C值 cost
2 Sigma值 sigma
相关应用案例
# 应用案例名称 应用案例介绍
1 UCI Iris 数据集支持向量机建模预测鸢花种类 UCI Iris 数据集,采用多分类支持向量机 C-SVC 方法建模,通过鸢花外形数据预测鸢花种类。
2 MNIST数据集SVM手写数字识别建模 MNIST数据集SVM手写数字识别建模
参考资料
暂无

目前平台处于试运行阶段,如有任何问题或建议,请发送邮件至 service@dataju.cn 或加入QQ群 565136792 联系管理员。