当前位置：文档之家› 分享最适合新手入门的10种机器学习算法

分享最适合新手入门的10种机器学习算法

分享最适合新手入门的10种机器学习算法
编者按：Medium博主James Le近日在网络上分享了他认为的最适合新手的机器学习算法，并授权论智进行编译。

以下是我们对原文的编译，如有错误还请指出。

在机器学习界，有这样一个“没有免费午餐”的定理。

简单地说，该理论认为，没有一种算法能解决所有问题，尤其对监督学习而言。

例如，你不能认为神经网络总比决策树要好，或决策树永远优于神经网络。

这其中还有许多因素需要考虑，比如你的数据量大小和数据结构。

这样就导致我们在面对一个问题时需要尝试不同的算法，同时还要用测试的数据集来评估算法的性能，选出最合适的那一种。

当然，你所选的算法必须适合你的问题，就像当我们需要清理房子的时候，可以使用吸尘器、扫把或拖把，但不会用铲子来挖地。

首要原则
然而，在为监督式机器学习创建预测模型之前，要记得一条最重要的原则：
机器学习算法可以看做学习一种目标函数（f），该函数是输入变量（X）到输出变量（Y）的完美映射：Y=f（X）
这是一个通用的学习任务，我们希望用新输入的变量（X）能输出预测变量（Y）。

我们不知道函数（f）是什么样子的，或者什么形式的。

如果我们知道的话就直接使用了，不需要再用机器学习算法从大量的数据中学习它。

最常见的机器学习类型是学习映射Y=f（X），用它来预测Y的值。

这被称为预测建模或预测分析，我们的目标是做出最准确的预测。

对于想了解机器学习基础知识的新手，以下是数据科学家最常用的10种机器学习算法。

1.线性回归
线性回归也许是数据科学和机器学习中最知名、最好理解的算法了吧。

预测建模主要关注的是，以可解释性为基础，将模型的误差降到最小并尽量作出最准确的预测。

我们将借鉴、多次使用甚至“窃取”包括数据统计在内的多个不同领域的算法，从。

e商务文档