为什么逻辑回归的损失函数具有对数表达式?
0 1559
0

逻辑回归的损失函数为

cost(h(theta)X,Y) = -log(h(theta)X) or -log(1-h(theta)X)

我的问题是将对数表达式用作损失函数的基础是什么?为什么要用“ -log”.

收藏
2021-03-21 17:44 更新 正直的烤面包 •  4006
共 1 个回答
高赞 时间
0

Hypothesis函数

当预测的变量y只能采用离散值(即:分类)时,要使用逻辑回归。

考虑到二元分类问题(y只能取两个值),然后具有一组参数θ和一组输入特征x,可以定义Hypothesis函数,使其范围在[0,1]之间,其中g() 表示S型函数:

该Hypothesis函数同时表示在θ参数化的输入为x的条件下上y = 1的估计概率:

损失函数

损失函数代表了优化目标。

尽管损失函数的定义可以是hypothesis h_θ(x) 与训练集中所有m个样本中的实际值y之间的欧式距离的平均值,但前提是Hypothesis函数是由S型函数形成的 ,此定义将导致非凸损失函数,这意味着可以在达到全局最小值之前轻松找到局部最小值。 为了确保损失函数是凸的(因此确保收敛到全局最小值),要使用S形函数的对数来转换成本函数。

由此,可以将优化目标函数定义为训练集中损失/错误的平均值:

参考https://stackoverflow.com/a/32987352/15018571

收藏
2021-03-21 17:58 更新 阿托 •  17095