如何向初学者解释机器学习中的支持向量机(SVM)?
0 1474
4
该提问暂无详细描述
收藏
2021-01-13 17:46 更新 天明 •  1294
共 1 个回答
高赞 时间
1

支持向量机是一种线性分类器。假设我们想通过画一条线把上面的黑圈和白圈分开。请注意,有无限多的线可以完成此任务,而支持向量机就是要找到“最大利润”线(线在中间)。从直觉上看,这种方法效果很好,因为它允许产生噪音,并且能够容忍任何一方的错误。 这就是(二进制)支持向量机的真正含义,即我们在数据中间画一条直线,把它分成两类。但是如果我们不想要直线而是曲线呢?这样的话,我们不能通过绘制曲线来实现这一目的,而是通过将我们观察到的特征“提升”到更高的维度。 例如,如果我们不能在空间(x1,x2)中画一条线,那么我们可以尝试添加第三个维度(x1,x2,x1*x2)。如果我们把高维度中的“线”(实际上叫做“超平面”)投影到原始维度,那么它看起来就像一条曲线。 通过使用内核技巧,可以非常有效地完成这些维度的增加(实际上,我们根本没有真正完成它们)。内核允许我们在非常高的维度,甚至无限维中绘制“直线”。 请注意,如果要绘制最大的边距线,请仅选择最接近该线的数据点要(具有较暗边框的数据点)。这些点被称为“支持向量”,即支持向量机名字的由来。

收藏
2021-01-13 17:57 更新 Lisa •  1802