0
EOOC是最为常用的多对多的多分类技术,是一种纠错输出码 EOOC是将编码的思想引入类别拆分,并尽可能在解码过程中具有容错性。EOOC工作过程主要分为两步: 编码:对N个类别做M次划分,每次划分将一部分类别划为正类,一部分划为反类,从而形成一个二分类训练集;这样一共产生M个训练集,可训练出M个分类器。 解码:M个分类器分别对测试样本进行预测,这些预测标记组成一个编码。将这个预测编码与每个类别各自的编码进行比较,返回其中距离最小的类别作为最终预测结果。 类别划分通过“编码矩阵”指定。编码矩阵有多种形式,常见的主要有二元码和三元码。 二元码:每个类别分别指定为正类和反类 三元码:在正类和反类之外还指定“停用类” 在上图a中,分类器f2将C1类和C3类的样例作为正例,C2类和C4类的样例作为反类; 在图b中,分类器f4将C1类和C4类的样例作为正例,C3类样例作为反例。在解码阶段,各分类器的预测结果联合起来形成了测试用例的编码,该编码与各类所对应的编码进行比较,将距离最小的编码所对应的类别作为预测结果。 例如在a中若基于欧氏距离,预测结果将是C3
收藏