当前位置:文档之家› 分享最适合新手入门的10种机器学习算法

分享最适合新手入门的10种机器学习算法

分享最适合新手入门的10种机器学习算法
编者按:Medium博主James Le近日在网络上分享了他认为的最适合新手的机器学习算法,并授权论智进行编译。

以下是我们对原文的编译,如有错误还请指出。

在机器学习界,有这样一个“没有免费午餐”的定理。

简单地说,该理论认为,没有一种算法能解决所有问题,尤其对监督学习而言。

例如,你不能认为神经网络总比决策树要好,或决策树永远优于神经网络。

这其中还有许多因素需要考虑,比如你的数据量大小和数据结构。

这样就导致我们在面对一个问题时需要尝试不同的算法,同时还要用测试的数据集来评估算法的性能,选出最合适的那一种。

当然,你所选的算法必须适合你的问题,就像当我们需要清理房子的时候,可以使用吸尘器、扫把或拖把,但不会用铲子来挖地。

首要原则
然而,在为监督式机器学习创建预测模型之前,要记得一条最重要的原则:
机器学习算法可以看做学习一种目标函数(f),该函数是输入变量(X)到输出变量(Y)的完美映射:Y=f(X)
这是一个通用的学习任务,我们希望用新输入的变量(X)能输出预测变量(Y)。

我们不知道函数(f)是什么样子的,或者什么形式的。

如果我们知道的话就直接使用了,不需要再用机器学习算法从大量的数据中学习它。

最常见的机器学习类型是学习映射Y=f(X),用它来预测Y的值。

这被称为预测建模或预测分析,我们的目标是做出最准确的预测。

对于想了解机器学习基础知识的新手,以下是数据科学家最常用的10种机器学习算法。

1.线性回归
线性回归也许是数据科学和机器学习中最知名、最好理解的算法了吧。

预测建模主要关注的是,以可解释性为基础,将模型的误差降到最小并尽量作出最准确的预测。

我们将借鉴、多次使用甚至“窃取”包括数据统计在内的多个不同领域的算法,从。

相关主题