0
首先,什么是LDA? 线性判别分析(LDA)是一种有监督的特征提取技术,用于查找可分离类别的可用特征的线性组合。 应用LDA后会发生什么? 其主要目的是降低数据的维数,来减少分类的计算损失。将LDA应用于数据集后,“新特征”最小化了同一类样本之间的离散度,最大化了不同类样本之间的离散度。 举一个例子: 假设你有一个从事不同运动的人的数据集:高尔夫、篮球、足球、足球,数据集可用的特征是身高、体重和肌肉指数。 绘制这些实例时,可能有两个或多个类的某些相交区域。因此,当你将LDA应用于数据集时,它将生成新的特征,这些特征可能具有更好的类分离(交集区域越来越少)。 使用LDA会有什么缺点? LDA是一种非常强大的技术,但是它有一些局限性。例如,有时你要处理10个特征的数据集,而只有2个类,因此LDA必须减少到2个轴。这种修正通常会导致信息的丢失,从而导致分类精度降低。
收藏