Logo hu.boatexistence.com

Miért oldja meg az lstm az eltűnő gradienst?

Tartalomjegyzék:

Miért oldja meg az lstm az eltűnő gradienst?
Miért oldja meg az lstm az eltűnő gradienst?

Videó: Miért oldja meg az lstm az eltűnő gradienst?

Videó: Miért oldja meg az lstm az eltűnő gradienst?
Videó: Long Short-Term Memory (LSTM), Clearly Explained 2024, Lehet
Anonim

LSTM-ek megoldják a problémát egy egyedi additív gradiens struktúra használatával, amely magában foglalja közvetlen hozzáférést a felejtőkapu aktiválásaihoz, lehetővé téve a hálózat számára, hogy a hibagradiensből a kívánt viselkedést ösztönözze a kapu gyakori frissítésével a tanulási folyamat minden lépésénél.

Hogyan oldja meg az LSTM a kirobbanó gradienst?

Egy nagyon rövid válasz: Az LSTM szétválasztja a cella állapotát (általában c-vel jelölve) és a rejtett réteget/kimenetet (jellemzően h-val), és csak additív frissítéseket végez a c-ben, ami stabilabbá teszi a c-beli memóriákat. Így a c-n átfolyó gradiens megmarad és nehezen tűnik el (ezért a teljes gradienst nehéz eltüntetni).

Hogyan lehet megoldani az eltűnő gradiens problémát?

Megoldások: A legegyszerűbb megoldás más aktiválási funkciók használata, például a ReLU, ami nem okoz kis derivált. A maradék hálózatok egy másik megoldást jelentenek, mivel közvetlenül a korábbi rétegekhez biztosítanak maradék kapcsolatokat.

Milyen problémát old meg az LSTM?

LSTM-ek. Az LSTM (a hosszú rövid távú memória rövidítése) elsősorban az eltűnő gradiens problémát oldja meg a visszaterjesztésben. Az LSTM-ek kapuzási mechanizmust használnak, amely vezérli a memográfiai folyamatot. Az LSTM-ekben lévő információk tárolhatók, írhatók vagy olvashatók nyíló és záródó kapukon keresztül.

Miért akadályozzák meg az LSTM-ek, hogy a színátmenetek eltűnjenek a visszafelé haladó hágóról?

Ennek az az oka, hogy ennek az állandó hibafolyamnak a kikényszerítése érdekében a gradiens számítást csonkolták, hogy ne áramoljon vissza a bemeneti vagy jelölt kapukhoz.

Ajánlott: