A deterministic gradient-based approach to avoid saddle points

Loss functions with a large number of saddle points are one of the major obstacles for training modern machine learning (ML) models efficiently. First-order methods such as gradient descent (GD) are usually the methods of choice for training ML models. However, these methods converge to saddle point...

Celý popis

Uloženo v:
Podrobná bibliografie
Vydáno v:European journal of applied mathematics Ročník 34; číslo 4; s. 738 - 757
Hlavní autoři: Kreusser, L. M., Osher, S. J., Wang, B.
Médium: Journal Article
Jazyk:angličtina
Vydáno: United States Cambridge University Press 01.08.2023
Témata:
ISSN:0956-7925, 1469-4425
On-line přístup:Získat plný text
Tagy: Přidat tag
Žádné tagy, Buďte první, kdo vytvoří štítek k tomuto záznamu!
Buďte první, kdo okomentuje tento záznam!
Nejprve se musíte přihlásit.