撰写于    浏览:53 次  分类: 算法工程师
算法工程师可投递简历的工作岗位有:机器学习 | 数据挖掘 | 算法工程师 | 基础研究一面考察要点:(1)C/C++,Python等开发语言的语法问题,例如:C++里面const有什么作用,C++里面static的作用等,主要考察应试者的对开发语言的掌握程度。(2)除了基本的语法规则考察以外,还会考察一下算法和数据结构题目,例如:判断一个数字是否为[...]

撰写于    浏览:40 次  分类: 简明机器学习教程
梯度的物理意义就是小球从山顶向下滚动,滚动的方向就是负梯度方向。小球滚动的方向是由重力和摩擦力共同来决定的,这个合力的方向和大小是个向量,这个向量就是梯度。向量只有大小和方向,与坐标系无关。如果想测量小球向下滚动的梯度,以小山为研究对象,任何角度勾画出一个坐标系都可以。即便坐标系换了角度,投影到X,Y轴的偏导可能不一样,但是梯度是不变的。虽然梯度不[...]

撰写于    浏览:37 次  分类: 简明机器学习教程
建好模型之后,必须对它进行评价,我们经常会使用一些评价指标来比较模型的预测准确度。常用的评价指标有:预测准确率,混淆矩阵,均方根误差等。1、分类指标1.1、预测准确率简单的说,就是正确的预测所占的比例。虽然它很简单容易理解,但是我们无法通过它得知预测误差是如何产生的。1.2、混淆矩阵混淆矩阵可以进一步了解预测模型的优缺点。通过样本的采集,我们能够直[...]

撰写于    浏览:39 次  分类: 简明机器学习教程
常用指标有3个:(1){X}的支持度表示X项出现的频率,可以表示为P(X)(2){X→Y}的置信度表示当X项出现时Y项同时出现的频率,可以表示为:P(XY)/P(X)(3){X→Y}的提升度表示X项和Y项一同出现的频率,并且考虑每项各自出现的频率,可以表示为:P(XY)/P(X)P(Y)。公式看起来很容易理解,但是在实际问题中,我们常用被项集这个概[...]

撰写于    浏览:36 次  分类: 简明机器学习教程
主成分可以用已有的一个或多个变量表示。 比如,可以使用生素C这个变量来区分不同的食物。因为蔬菜含维生素C而肉类普遍缺乏,所以可以通过维生素C这个变量区分蔬菜和肉类,但是无法进步区分不同的肉类。为了进一步区分不同的肉类,可以选择把脂肪含量作为第2个变量,因为肉类含有脂肪,而大部分蔬菜则不然。由于脂肪和维生素C的计量单位不同,因此在组合之前,必须先对它[...]