0
机器学习算法和机器学习模型之间存在差异。机器学习算法是一种广义的数学学习技术,而机器学习模型是在训练数据上运行算法时获得的结果,也是用来对新数据进行预测的结果。 对于一个建立了特定算法的模型评估,有三点值得你注意: 1.根据性能度量测试模型的性能,或者说是评估误差度量。最流行的误差度量方法是混淆矩阵。 混淆矩阵是描述模型性能的矩阵。混淆矩阵的关键参数是准确度、精确度和召回率。 准确度指从所有数据中正确地预测数据值。 准确度=(TP+TN)/(TP+FN+FP+TN) 召回指从实际正值(TP+FN)准确地预测正值(TP)。 召回率=TP/(TP+FN) 精度指根据预测正值(TP+FP)准确地预测正值(TP)。 精度=TP/(TP+FP) 2.训练和测试数据集。 在创建预测模型时,有必要验证模型是否给出了正确的预测。为了验证,我们使用可用的数据并训练现有的数据来预测可用的目标。因此,将数据集分为训练数据集和测试数据集是机器学习中的一种普遍做法。这样,就可以通过在训练据集上训练模型并在测试期间对其进行评估来构建模型数据集。根据数据的大小,拆分的比率可以是80:20或70:30。 3.交叉验证。 一般来说,数据的分布也会影响分类模型的性能。因此,为了使性能独立于分布,要进行交叉验证。在交叉验证中,我们将数据分布在k个层中,并测试每层的性能。
收藏