极大似然估计与贝叶斯估计
通过贝叶斯等方式实现分类器时,需要首先得到先验概率以及类条件概率密度。但在实际的应用中,先验概率与类条件概率密度并不能直接获得,它们都需要通过估计的方式来求得一个近似解。若先验概率的分布形式已知(或可以假设为某个分布),但分布的参数未知,则可以通过极大似然或者贝叶斯来获得对于参数的估计。
Keep It Simple, Stupid !
通过贝叶斯等方式实现分类器时,需要首先得到先验概率以及类条件概率密度。但在实际的应用中,先验概率与类条件概率密度并不能直接获得,它们都需要通过估计的方式来求得一个近似解。若先验概率的分布形式已知(或可以假设为某个分布),但分布的参数未知,则可以通过极大似然或者贝叶斯来获得对于参数的估计。
在做分类问题时,有时候需要使用样本的概率密度函数来求其后验概率。但是很多情况下并不知道其概率密度函数的形式(即样本的分布未知),此时就需要对样本进行非参数估计,来求解其概率密度函数。
支持向量机(Support Vector Machines SVM)是一种二分类模型,它的目标是在特征空间中寻找对于所有样本距离最大的超平面。与感知机不同的是,在线性可分的情况下,SVM可以得到唯一的解。
1.感知机模型 感知机:假设输入空间为X,输出空间为Y,其中Y={+1,-1}。由输入空间到输出空间的如下函数f(x),称为感知机。其中,w和b为感知机模型参数,w为权重值,b为偏置,sign为符号函数。
1.统计学习 赫尔伯特·西蒙曾对学习给出以下定义: 如果一个系统能够通过执行某个过程改进它的性能,这就是学习。 统计学习就是计算机系统通过运用数据及统计方法提高系统性能的机器学习。
朴素贝叶斯是基于贝叶斯公式和属性条件独立假设的一种分类方式。它是一种“生成式模型”,先通过样本估计先验概率,然后用它来求出后验概率。
虽然logistic regression名为回归,但却是一个机器学习中的分类方法。我们先用它来处理二分类问题,基本模型如下,定义出了Y=1和Y=0的概率。
手写数字识别是属于机器学习中的分类问题,它有许多的机器学习的算法可以解决,如SVM,CNN等。最近在Kaggle上看到这一问题,并且恰巧之前有学过一些卷积神经网络(Convolutional Neural Network),于是打算用Python写一个简单CNN,实现手写数字识别器。
线性模型,是通过相关数据的线性组合来构成的模型(如下式)。而线性回归是机器学习中的一类问题,它试图通过学习已有数据而获得一个线性的模型,以此来预测某一个问题的实际输出值。
通过上一篇文章,我们可以发现游戏的评分机制不仅和KDA有关,还受其它因素影响。于是重新定义一个模型如下:
当一局游戏结束,总有一些疑问:为什么我的评分这么低,为什么不是我的MVP?虽然菜是原罪,但游戏具体的评分仅仅是根据KDA(KILL,DEATH,ASSIST)计算出来或是还有其它参数,另外具体的算法又是如何?因为之前有看过一个老师使用梯度下降算法来分析Pokemon的CP(combat power)值是如何进化的,于是也想借用该算法来分析王者荣耀的评分机制。