距离度量方法
距离度量方法如下:
1、欧氏距离。
欧氏距离度量两个实值向量之间的最短距离。
由于其直观,使用简单和对许多用例有良好结果,所以它是最常用的距离度量和许多应用程序的默认距离度量。
欧氏距离有两个主要缺点。
首先,距离测量不适用于比2D或3D 空间更高维度的数据。
第二,如果我们不将特征规范化和/或标准化,距离可能会因为单位的不同而倾斜。
2、曼哈顿距离。
曼哈顿距离也被称为出租车或城市街区距离,因为两个实值向量之间的距离是根据一个人只能以直角移动计算的。
这种距离度量通常用于离散和二元属性,这样可以获得真实的路径。
曼哈顿的距离有两个主要的缺点。
它不如高维空间中的欧氏距离直观,它也没有显示可能的最短路径。
虽然这可能没有问题,但我们应该意识到这并不是最短的距离。
3、切比雪夫距离。
切比雪夫距离也称为棋盘距离,因为它是两个实值向量之间任意维度上的最大距离。
它通常用于仓库物流中,其中最长的路径决定了从一个点到另一个点所需的时间。
4、闵可夫斯基距离。
闵可夫斯基距离是上述距离度量的广义形式。
它可以用于相同的用例,同时提供高灵活性。
我们可以选择p值来找到最合适的距离度量。
由于闵可夫斯基距离表示不同的距离度量,它就有与它们相同的主要缺点,例如在高维空间的问题和对特征单位的依赖。
此外,p值的灵活性也可能是一个缺点,因为它可能降低计算效率,因为找到正确的p值需要进行多次计算。