Der Logarithmischer Verlust (engl. log loss), allgemein bekannt als Log Loss oder Cross-Entropy Loss, ist eine zentrale Kennzahl im Machine Learning, insbesondere bei Klassifikationsproblemen. Er bewertet die Leistung eines Klassifikationsmodells, indem er den Unterschied zwischen vorhergesagten Wahrscheinlichkeiten und den tatsächlichen Ergebnissen misst. Wie werfen einen Blick auf das Konzept hinter Log Loss, seiner Bedeutung und zeigen ein praktisches Beispiel mit Python und scikit-learn.
Was ist Log Loss?
Log Loss ist eine logarithmische Transformation der Likelihood‑Funktion und wird hauptsächlich zur Bewertung der Leistung probabilistischer Klassifikatoren verwendet. Im Gegensatz zu anderen Metriken wie der Genauigkeit berücksichtigt Log Loss die Unsicherheit von Vorhersagen, indem Modelle für selbstbewusst falsche Vorhersagen deutlich stärker bestraft werden.
\(y_i\) ist die binäre Vorhersage (also \(0\) oder \(1\)) der i. Beobachtung.
\(p_i\) ist die Vorhersagewahrscheinlichkeit, das die i. Beobachtung zur Klasse \(1\) gehört.
Verständnis von Log Loss‑Werten
Ein niedriger Log Loss weist auf eine bessere Modellleistung hin. Ein Log Loss von \(0\) bedeutet, dass die vorhergesagten Wahrscheinlichkeiten die tatsächlichen Ergebnisse perfekt widerspiegeln, während höhere Werte auf zunehmende Abweichungen hinweisen. Es ist wichtig zu beachten, dass Log Loss empfindlich auf die Sicherheit der Vorhersagen reagiert, was ihn zu einer leistungsstarken Kennzahl für die Bewertung probabilistischer Modelle macht.
Log Loss in Klassifikationsproblemen
Log Loss wird häufig in binären und multiklassigen Klassifikationsproblemen verwendet, insbesondere bei Modellen, die Wahrscheinlichkeitswerte für jede Klasse ausgeben (z.B. logistische Regression, neuronale Netze). Er motiviert Modelle dazu, nicht nur korrekt, sondern auch sicher in ihren Vorhersagen zu sein, was ihn besonders nützlich in Szenarien macht, in denen Fehlklassifikationen unterschiedlich hohe Kosten verursachen.
Ein LogLoss von \(`python print(f"{loss:.4}"))`\) bedeutet, das Modell relativ gut kalibriert ist. Die vorhergesagten Wahrscheinlichkeiten liegen meist nah an den tatsächlichen Werten (Labels). Es macht wenige selbstbewusst falsche Vorhersagen.
Die LogLoss Funktion gibt es aber auch für nicht-binäre Vorhersagen.