2019年6月


撰写于    浏览:922 次  分类: 机器学习
处理缺失值主要有以下几种方法:(1)当某个变量的缺失值占比过大时,那么我们可以认为这一变量没有意义,可以直接删除。(2)缺失值可以用平均值、中值、分位数、众数、随机值等替代,但是效果一般,因为等于人为增加了噪声。(3)用其他变量做预测模型来算出缺失变量,效果比方法2略好,但有一个根本缺陷,如果其他变量和缺失变量无关,则预测的结果无意义。如果预测结果[...]

撰写于    浏览:830 次  分类: 机器学习
1、什么是特征?特征通常是建立在原始数据之上的特定表示,通常用数据集中的列表示。对于一个通用的二维数据集,每个观测值由一行表示,每个特征由一列表示,对于每一个观测具有一个特定的值。2、特征工程是什么?当你想要自己的预测模型性能达到最佳时,你要做的不仅是要选取最好的算法,还要尽可能的从原始数据中获取更多的信息。这就是特征工程要做的事,它的目的就是获取[...]

撰写于    浏览:1033 次  分类: 微积分
数学是什么?在很多人的眼里,数学是公式。这个回答没有问题,对于一名中学生来说,对于一名大学生来说,这个回答一点问题都没有。但是世间万物在发展,人的年龄和阅历在增加,如果一个人一直还是这么认为,那么就有问题了。还是停留在书本上白纸黑字版本的数学概念、数学术语、数学公式层面,没有深化,没有升华,那肯定是有问题的。数学是公式,这是我对数学的第一阶段认识。[...]

撰写于    浏览:823 次  分类: 机器学习
模型,就是函数,模型通常分为下面三类:(1)线性模型(2)核模型(3)层次模型

撰写于    浏览:914 次  分类: 机器学习
1、什么是模型呢?简单的说,模型就是函数,就是数学公式。2、什么是拟合呢?经常看到一些复杂的公式,结构对称,身段优美,是某个天才晚上做梦想出来的吗?看下面这个公式:显然不太可能。那么它是怎么来的呢?我猜测:先画出来的,然后测算若干个x和y的关系,最后试出来的公式。这是一个根据数据不断猜和尝试的过程。上述的过程,就是拟合的过程。拟合,指的是对一些数据[...]

撰写于    浏览:1087 次  分类: 微积分
回归过去走过的路,风风雨雨十多年过去了,如果没有数学,我相信自己的命运不会这么顺利。知识改变命运,对我而言,是数学改变命运。如果不是数学,高考也好,考研也好,都难以有所突破。最后的突破往往都归结于数学给自己提升了不少分。在备考的过程中,我做了大量的数学习题,而且反复的做,做的滚瓜烂熟,在这个阶段,我认识到:数学就是公式,只有十分扎实和熟练的掌握数学[...]