深度学习的激活函数：sigmoid、tanh、ReLU 、Leaky Relu、RReLU、softsign 、softplus、GELU

2019-05-06 17:56:43 wamg潇潇阅读数 652更多

分类专栏： python机器学习深度学习

本文链接：https://blog.csdn.net/qq_29831163/article/details/89887655

【 tensorflow中文文档：tensorflow 的激活函数有哪些】

激活函数可以分为两大类：

饱和激活函数： sigmoid、 tanh
非饱和激活函数: ReLU 、Leaky Relu 、ELU【指数线性单元】、PReLU【参数化的ReLU 】、RReLU【随机ReLU】

相对于饱和激活函数，使用“非饱和激活函数”的优势在于两点：
1.首先，“非饱和激活函数”能解决深度神经网络【层数非常多！！】的“梯度消失”问题，浅层网络【三五层那种】才用sigmoid 作为激活函数。
2.其次，它能加快收敛速度。

（1）sigmoid 函数 (以前最常用)

（2）tanh (双曲正切函数 ;Hyperbolic tangent function)

(3) relu （Rectified linear unit; 修正线性单元）

（4）Leaky Relu (带泄漏单元的relu ) (5) RReLU（随机ReLU）

（6）softsign （7）softplus （8）Softmax

（9）阈值函数、阶梯函数（10）分段线性函数

（1）sigmoid 函数 (以前最常用)

参数 α > 0 可控制其斜率。 sigmoid 将一个实值输入压缩至[0,1]的范围,也可用于二分类的输出层。

技术分享

（2）tanh (双曲正切函数 ;Hyperbolic tangent function)

将一个实值输入压缩至 [-1, 1]的范围，这类函数具有平滑和渐近性，并保持单调性.

(3) relu （Rectified linear unit; 修正线性单元）

深度学习目前最常用的激活函数

# Relu在tensorflow中的实现：直接调用函数
tf.nn.relu( features, name= None )

与Sigmoid/tanh函数相比，ReLu激活函数的优点是：

使用梯度下降（GD）法时，收敛速度更快
相比Relu只需要一个门限值，即可以得到激活值，计算速度更快

缺点是： Relu的输入值为负的时候，输出始终为0，其一阶导数也始终为0，这样会导致神经元不能更新参数，也就是神经元不学习了，这种现象叫做“Dead Neuron”。

为了解决Relu函数这个缺点，在Relu函数的负半区间引入一个泄露（Leaky）值，所以称为Leaky Relu函数。

（4）Leaky Relu (带泄漏单元的relu )

数学表达式： y = max(0, x) + leak*min(0,x)

与 ReLu 相比，leak 给所有负值赋予一个非零斜率， leak是一个很小的常数 $\large a_{i}$ ，这样保留了一些负轴的值，使得负轴的信息不会全部丢失）

leaky ReLU

#leakyRelu在tennsorflow中的简单实现
tf.maximum(leak * x, x),

比较高效的写法为：

import tensorflow as tf
def LeakyReLU(x,leak=0.2,name="LeakyReLU"):
with tf.variable_scope(name):
f1 = 0.5*(1 + leak)
f2 = 0.5*(1 - leak)
return f1*x+f2*tf.abs(x)

(5) RReLU（随机ReLU）

在训练时使用RReLU作为激活函数，则需要从均匀分布U(I,u)中随机抽取的一个数值 $\large a_{ji}$ ，作为负值的斜率。

（6）softsign

数学表达式：

$\large f\left ( x \right )= \frac{x}{1+\left | x \right |}$ ，导数： $\large f{}'\left ( x \right )= \frac{1}{\left ( 1+\left | x \right | \right )^{2}}$

（7）softplus

Softplus函数是Logistic-Sigmoid函数原函数。 $\large Softplus(x)=log(1+e^x)$ ,加了1是为了保证非负性。Softplus可以看作是强制非负校正函数max(0,x)平滑版本。红色的即为ReLU。

技术分享

（8）Softmax

用于多分类神经网络输出

（11）GELU ：高斯误差线性单元

在这篇论文中，作者展示了几个使用GELU的神经网络优于使用ReLU作为激活的神经网络的实例。GELU也被用于BERT。

GELU、ReLU和LeakyReLU的函数

def gelu(x):
return 0.5 * x * (1 + math.tanh(math.sqrt(2 / math.pi) * (x + 0.044715 * math.pow(x, 3))))
def relu(x):
return max(x, 0)
def lrelu(x):
return max(0.01*x, x)

以下两个是以前使用的：

（9）阈值函数、阶梯函数

相应的输出 $\large y_{k}$ 为

（10）分段线性函数

它类似于一个放大系数为 1 的非线性放大器，当工作于线性区时它是一个线性组合器，放大系数趋于无穷大时变成一个阈值单元。

3.Swish函数
Swish函数是一种自控门的激活函数，其定义：
Swish(x)=xσ(βx) Swish(x) = x\sigma(\beta x)
Swish(x)=xσ(βx)

其中，σ(⋅) \sigma(·)σ(⋅)函数是logistic函数，其值域在(−1,1) (-1,1)(−1,1)，β \betaβ是一个参数。也就是说当σ(⋅) \sigma(·)σ(⋅)趋近于1的时候，其输出和x xx本身近似；当σ(⋅) \sigma(·)σ(⋅)趋近于0的时候，其输出趋近于0。

3、基于Gate mechanism的GLU、GTU 单元

介绍一下基于gate mechanism实现的，两个比较新颖的激活函数GTU和GLU。

GTU（Gated Tanh Unit）的表达式为：

f(X) = tanh(X*W+b) * O(X*V+c)

GLU（Gated Liner Unit）的表达式为：

f(X) = (X * W + b) * O(X * V + c)

分析GTU和GLU的组成结构可以发现：

Tanh激活单元：tanh(X*W+b)，加上一个Sigmoid激活单元：O(X*V+c)构成的gate unit，就构成了GTU单元。

Relu激活单元：(X * W + b)，加上一个Sigmoid激活单元：O(X * V + c)构成的gate unit，就构成了GLU单元。

原文链接：https://blog.csdn.net/lqfarmer/article/details/72676715

菜单 学习猿地 - LMONKEY

开通学习猿地VIP

尊享10项VIP特权 持续新增

知识通关挑战

打卡带练！告别无效练习

接私单赚外块

VIP优先接，累计金额超百万

学习猿地私房课免费学

大厂实战课仅对VIP开放

你的一对一导师

每月可免费咨询大牛30次

领取更多软件工程师实用特权

Java开发工程师

何以解忧，唯有 Java！

Python开发工程师

人生苦短我要学Python！

PHP开发工程师

PHP是世界上最好的编程语言!

GO开发工程师

想优雅的写程序，赶紧GO!

大数据开发工程师

弄大数据，就是在搞革命!

前端开发工程师

不仅最好，而且最全!

UI开发工程师

这个世界从来不缺少美，缺少你来创造美!

Linux运维工程师

不只是说说而已！

WEB前端1+X

不仅为考证，轻松做开发

计算机二级（C语言）

一切只为考证！

猿工手册

各种工具精挑细选

猿材料

各种工具精挑细选

猿代码

各种工具精挑细选

猿著课件

各种工具精挑细选

知识题库

知识闯关节节高，刷题涨知识！

阶段练习

单元测试知识学习状况秒掌握！

期末考试

期末测试，学习情况即刻知道！

面试题库

最新的企业技术人员招聘真题练习！

Java专区

2948篇 ｜ 24.5万人浏览

Python专区

2593篇 ｜ 19.5万人浏览

大数据专区

2948篇 ｜ 18.5万人浏览

PHP专区

3953篇 ｜ 27.5万人浏览

Go专区

1382篇 ｜ 12.5万人浏览

Web前端专区

1453篇 ｜ 31.5万人浏览

Linux云计算

1230篇 ｜ 4.5万人浏览

其他专区

53232篇文章 ｜ 11.5万人浏览

搜索

历史记录 清除记录

近期热搜

项目开发全程实录（电商EW_Shop）

8680 人 1年前

轻松学会Laravel-项目篇（商城API）

2022 人 1年前

Python数据分析2.0-金融

325 人 1年前

Python办公自动化2.0

241 人 1年前

使用账号登录

启用更安全省心的  微信登录

Java开发工程师

何以解忧，唯有 Java！

Python开发工程师

菜单学习猿地 - LMONKEY

尊享10项VIP特权持续新增

2948篇｜ 24.5万人浏览

2593篇｜ 19.5万人浏览

2948篇｜ 18.5万人浏览

3953篇｜ 27.5万人浏览

1382篇｜ 12.5万人浏览

1453篇｜ 31.5万人浏览

1230篇｜ 4.5万人浏览

53232篇文章｜ 11.5万人浏览

历史记录清除记录

2948篇｜ 24.5万人浏览

2593篇｜ 19.5万人浏览

2948篇｜ 18.5万人浏览

3953篇｜ 27.5万人浏览

1382篇｜ 12.5万人浏览

1453篇｜ 31.5万人浏览

1230篇｜ 4.5万人浏览

53232篇文章｜ 11.5万人浏览

深度学习的激活函数：sigmoid、tanh、ReLU 、Leaky Relu、RReLU、softsign 、softplus、GELU

深度学习的激活函数：sigmoid、tanh、ReLU 、Leaky Relu、RReLU、softsign 、softplus、GELU

(3) relu （Rectified linear unit; 修正线性单元）

（9）阈值函数、阶梯函数