当前位置:网站首页 > Haskell函数式编程 > 正文

sigmoid函数和logistic(sigmoid函数和逻辑回归)



在机器学习之逻辑回归介绍中,我们讨论了逻辑回归的概念以及其算法原理推导。

一、逻辑回归的概念

逻辑回归又称logistic回归分析,是一种广义的线性回归分析模型,常用于数据挖掘,经济预测等领域。逻辑回归从本质来说属于二分类问题,是基于Sigmoid函数(又叫“S型函数”)的有监督二类分类模型。

二、Sigmoid函数

Sigmoid函数公式为:

逻辑回归为什么要用sigmoid函数 知乎 逻辑回归和sigmoid函数_过拟合

其导数形式为:(注意,导数形式在后期会被用到)

逻辑回归为什么要用sigmoid函数 知乎 逻辑回归和sigmoid函数_正则_02

Sigmoid函数其图像如下所示,其取值范围被压缩到0到1之间。

逻辑回归为什么要用sigmoid函数 知乎 逻辑回归和sigmoid函数_过拟合_03

中的 z 就对应训练集中某个样本的信息。 而样本信息通常用一系列特征的线性组合来表示,即

逻辑回归为什么要用sigmoid函数 知乎 逻辑回归和sigmoid函数_广义线性模型_04

逻辑回归为什么要用sigmoid函数 知乎 逻辑回归和sigmoid函数_过拟合_05

逻辑回归为什么要用sigmoid函数 知乎 逻辑回归和sigmoid函数_正则_06

逻辑回归为什么要用sigmoid函数 知乎 逻辑回归和sigmoid函数_过拟合_07

逻辑回归为什么要用sigmoid函数 知乎 逻辑回归和sigmoid函数_广义线性模型_08

逻辑回归为什么要用sigmoid函数 知乎 逻辑回归和sigmoid函数_过拟合_09

逻辑回归为什么要用sigmoid函数 知乎 逻辑回归和sigmoid函数_正则_10

逻辑回归为什么要用sigmoid函数 知乎 逻辑回归和sigmoid函数_过拟合_11

逻辑回归为什么要用sigmoid函数 知乎 逻辑回归和sigmoid函数_广义线性模型_12

三、逻辑回归为什么要用sigmoid函数而不是用其他呢?

首先需要了解几个知识点:A.指数族分布 B.广义线性模型

A.指数族分布

指数族分布下面的公式,即:

逻辑回归为什么要用sigmoid函数 知乎 逻辑回归和sigmoid函数_过拟合_13

其中,η为自然参数,T(y)为充分统计量,通常T(y)=y,α(η)为正则化项。

B.广义线性模型

满足下面三个假设的模型成为广义线性模型:

逻辑回归为什么要用sigmoid函数 知乎 逻辑回归和sigmoid函数_正则_14

逻辑回归为什么要用sigmoid函数 知乎 逻辑回归和sigmoid函数_正则_15

逻辑回归为什么要用sigmoid函数 知乎 逻辑回归和sigmoid函数_广义线性模型_16

因为逻辑回归假设数据服从伯努利分布,我们用一个简单例子来介绍伯努利分布:抛硬币,一枚硬币抛中正面的概率为p,那么反面的概率则为1-p。

伯努利分布的概率质量函数(PMF)为:

逻辑回归为什么要用sigmoid函数 知乎 逻辑回归和sigmoid函数_过拟合_17

分段函数比较简单易懂,但是对于后面的推导比较麻烦,于是有:

逻辑回归为什么要用sigmoid函数 知乎 逻辑回归和sigmoid函数_正则_18

对上式进行log操作

逻辑回归为什么要用sigmoid函数 知乎 逻辑回归和sigmoid函数_广义线性模型_19

其中,令

逻辑回归为什么要用sigmoid函数 知乎 逻辑回归和sigmoid函数_过拟合_20

所以可以得出伯努利分布属于指数族分布。

即伯努利分布满足广义线性模型的第一个假设,下面利用广义线性模型后面两个假设得到:

逻辑回归为什么要用sigmoid函数 知乎 逻辑回归和sigmoid函数_正则_21

四、目标函数

逻辑回归为什么要用sigmoid函数 知乎 逻辑回归和sigmoid函数_正则_22

是训练集中第 i 个样本已经被标记好的类别,若

逻辑回归为什么要用sigmoid函数 知乎 逻辑回归和sigmoid函数_过拟合_23

逻辑回归为什么要用sigmoid函数 知乎 逻辑回归和sigmoid函数_正则_24

逻辑回归为什么要用sigmoid函数 知乎 逻辑回归和sigmoid函数_广义线性模型_25

五、求解过程与正则化

在实际应用中,为了防止过拟合,使得模型具有较强的泛化能力,往往还需要在目标函数中加入正则项。在逻辑回归的实际应用中,L1正则应用较为广泛,原因是在面临诸如广告系统等实际应用的场景,特征的维度往往达到百万级甚至上亿,而L1正则会产生稀疏模型,在避免过拟合的同时起到了特征选择的作用。

六、总结

优点:

简单易于实现。

逻辑回归可以输出一个[0,1]之间的浮点数,也就是不仅可以产生分类的类别,同时产生属于该类别的概率。

逻辑回归是连续可导的,易于最优化求解。

缺点:

容易过拟合

原始的逻辑回归只能处理两分类问题,且必须线性可分。

七、拓展

为什么逻辑回归使用交叉熵损失函数而不用均方误差?

到此这篇sigmoid函数和logistic(sigmoid函数和逻辑回归)的文章就介绍到这了,更多相关内容请继续浏览下面的相关推荐文章,希望大家都能在编程的领域有一番成就!

版权声明


相关文章:

  • 快程序卸载(软件卸载快捷方式)2025-02-18 09:54:06
  • pcap文件格式解析库(pcapng文件格式)2025-02-18 09:54:06
  • max函数的功能和使用方法(max 函数的功能是什么?怎么用?)2025-02-18 09:54:06
  • ip地址计算公式(ip地址计算公式简单)2025-02-18 09:54:06
  • raise三单(raise三单形式)2025-02-18 09:54:06
  • pdf模式下怎么截图(pdf怎么直接截图)2025-02-18 09:54:06
  • clock函数返回值(clock函数的使用方法)2025-02-18 09:54:06
  • sigmoid函数求导范围(sigmoid函数的值域)2025-02-18 09:54:06
  • hprof文件怎么打开(hpm格式文件怎么打开)2025-02-18 09:54:06
  • 进程控制块的组织方式有哪几种?(进程控制块的组织方式有哪几种形式)2025-02-18 09:54:06
  • 全屏图片