分类 简明机器学习教程 下的文章


撰写于    浏览:40 次  分类: 简明机器学习教程
梯度的物理意义就是小球从山顶向下滚动,滚动的方向就是负梯度方向。小球滚动的方向是由重力和摩擦力共同来决定的,这个合力的方向和大小是个向量,这个向量就是梯度。向量只有大小和方向,与坐标系无关。如果想测量小球向下滚动的梯度,以小山为研究对象,任何角度勾画出一个坐标系都可以。即便坐标系换了角度,投影到X,Y轴的偏导可能不一样,但是梯度是不变的。虽然梯度不[...]

撰写于    浏览:37 次  分类: 简明机器学习教程
建好模型之后,必须对它进行评价,我们经常会使用一些评价指标来比较模型的预测准确度。常用的评价指标有:预测准确率,混淆矩阵,均方根误差等。1、分类指标1.1、预测准确率简单的说,就是正确的预测所占的比例。虽然它很简单容易理解,但是我们无法通过它得知预测误差是如何产生的。1.2、混淆矩阵混淆矩阵可以进一步了解预测模型的优缺点。通过样本的采集,我们能够直[...]

撰写于    浏览:39 次  分类: 简明机器学习教程
常用指标有3个:(1){X}的支持度表示X项出现的频率,可以表示为P(X)(2){X→Y}的置信度表示当X项出现时Y项同时出现的频率,可以表示为:P(XY)/P(X)(3){X→Y}的提升度表示X项和Y项一同出现的频率,并且考虑每项各自出现的频率,可以表示为:P(XY)/P(X)P(Y)。公式看起来很容易理解,但是在实际问题中,我们常用被项集这个概[...]

撰写于    浏览:36 次  分类: 简明机器学习教程
主成分可以用已有的一个或多个变量表示。 比如,可以使用生素C这个变量来区分不同的食物。因为蔬菜含维生素C而肉类普遍缺乏,所以可以通过维生素C这个变量区分蔬菜和肉类,但是无法进步区分不同的肉类。为了进一步区分不同的肉类,可以选择把脂肪含量作为第2个变量,因为肉类含有脂肪,而大部分蔬菜则不然。由于脂肪和维生素C的计量单位不同,因此在组合之前,必须先对它[...]

撰写于    浏览:39 次  分类: 简明机器学习教程
尽管K均值聚类方法很有用,但是它有一定的局限:(1)每个数据点只能属于一个群组。然而,数据点可能恰好位于两个群组中间,无法通过k均值聚类方法确定它应该属于哪个群组(2)群组被假定是正圆形的。查找距离某个群组中心点最近的数据点,这一迭代过程类似于缩小群组的半径,因此最终得到的群组在形状上类似于正圆形。假设群组的实际形状是椭圆形,那么在应用k均值聚类方[...]