首頁(yè)人工智能技術(shù)資訊正文

什么是梯度消失或爆炸？

更新時(shí)間:2022年03月03日13時(shí)59分來(lái)源:傳智教育瀏覽次數(shù):

什么是梯度消失或爆炸

根據(jù)反向傳播算法和鏈?zhǔn)椒▌t, 梯度的計(jì)算可以簡(jiǎn)化為以下公式:

其中sigmoid的導(dǎo)數(shù)值域是固定的, 在[0, 0.25]之間, 而一旦公式中的w也小于1, 那么通過(guò)這樣的公式連乘后, 最終的梯度就會(huì)變得非常非常小, 這種現(xiàn)象稱作梯度消失. 反之, 如果我們?nèi)藶榈脑龃體的值, 使其大于1, 那么連乘夠就可能造成梯度過(guò)大, 稱作梯度爆炸。

梯度消失或爆炸的危害:

如果在訓(xùn)練過(guò)程中發(fā)生了梯度消失，權(quán)重?zé)o法被更新，最終導(dǎo)致訓(xùn)練失敗; 梯度爆炸所帶來(lái)的梯度過(guò)大，大幅度更新網(wǎng)絡(luò)參數(shù)，在極端情況下，結(jié)果會(huì)溢出(NaN值)。

猜你喜歡：

Fast算法原理：fastica算法步驟詳解

Shi-Tomasi角點(diǎn)檢測(cè)原理和實(shí)現(xiàn)代碼

人工智能的起源和人工智能發(fā)展歷程

英偉達(dá)發(fā)布Orin系統(tǒng)芯片助力AI加速

傳智教育Ai人工智能培訓(xùn)

上一篇：什么是注意力機(jī)制？注意力機(jī)制的實(shí)現(xiàn)步驟 下一篇：Django中提供的常用列表頁(yè)選項(xiàng)

最新資訊

相關(guān)閱讀

0 分享到：

javaee

python

web

design

cloud

test

c

netmarket

pm

Linux

movies

robot

uids

Python

jdbc

北京校區(qū)

申請(qǐng)?jiān)嚶犆~

申請(qǐng)?jiān)嚶犆~

申請(qǐng)?jiān)嚶犆~

申請(qǐng)?jiān)嚶犆~

申請(qǐng)?jiān)嚶犆~

申請(qǐng)?jiān)嚶犆~

申請(qǐng)?jiān)嚶犆~

申請(qǐng)?jiān)嚶犆~

申請(qǐng)?jiān)嚶犆~

申請(qǐng)?jiān)嚶犆~

申請(qǐng)?jiān)嚶犆~

申請(qǐng)?jiān)嚶犆~

申請(qǐng)?jiān)嚶犆~

申請(qǐng)?jiān)嚶犆~

熱門課程推薦

更多>>

首頁(yè)|校區(qū)分布|師資力量|關(guān)于我們|報(bào)名流程

常見問(wèn)題|技術(shù)資訊

江蘇傳智播客教育科技股份有限公司版權(quán)所有
Copyright 2006-2023, All Rights Reserved

在線咨詢我要報(bào)名

和我們?cè)诰€交談！