A deterministic gradient-based approach to avoid saddle points

Loss functions with a large number of saddle points are one of the major obstacles for training modern machine learning (ML) models efficiently. First-order methods such as gradient descent (GD) are usually the methods of choice for training ML models. However, these methods converge to saddle point...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:European journal of applied mathematics Jg. 34; H. 4; S. 738 - 757
Hauptverfasser: Kreusser, L. M., Osher, S. J., Wang, B.
Format: Journal Article
Sprache:Englisch
Veröffentlicht: United States Cambridge University Press 01.08.2023
Schlagworte:
ISSN:0956-7925, 1469-4425
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!