Was ist LASSO?

LASSO, kurz für Least Absolute Shrinkage and Selection Operator, ist eine statistische Formel, deren Hauptzweck die Merkmalsauswahl und Regularisierung von Datenmodellen ist. Die Methode wurde erstmals 1996 von Statistikprofessor Robert Tibshirani eingeführt. LASSO führt Parameter in die Summe eines Modells ein und gibt ihm eine Obergrenze, die als Einschränkung für die Summe dient, um absolute Parameter innerhalb eines zulässigen Bereichs einzuschließen.

Lasso

Die LASSO-Methode reguliert Modellparameter, indem die Regressionskoeffizienten verkleinert und einige von ihnen auf Null reduziert werden. Die Merkmalsauswahlphase erfolgt nach dem Schrumpfen, wobei jeder Wert ungleich Null ausgewählt wird, um im Modell verwendet zu werden. Diese Methode ist wichtig für die Minimierung von Vorhersagefehlern, die in statistischen Modellen häufig vorkommen. Quantitative Analyse Bei der quantitativen Analyse werden messbare und überprüfbare Daten wie Einnahmen, Marktanteile und Löhne gesammelt und ausgewertet, um das Verhalten und die Leistung von a zu verstehen Unternehmen. Im Zeitalter der Datentechnologie wird die quantitative Analyse als bevorzugter Ansatz für fundierte Entscheidungen angesehen. .

LASSO bietet Modelle mit hoher Vorhersagegenauigkeit an. Die Genauigkeit nimmt zu, da das Verfahren eine Schrumpfung der Koeffizienten beinhaltet, was wiederum die Varianz verringert und die Vorspannung minimiert. Es funktioniert am besten, wenn die Anzahl der Beobachtungen gering und die Anzahl der Merkmale hoch ist. Es hängt stark vom Parameter λ ab, der der steuernde Faktor für die Schrumpfung ist. Je größer λ wird, desto mehr Koeffizienten werden gezwungen, Null zu sein.

Wenn λ gleich Null ist, wird das Modell zur Regression der kleinsten Quadrate. Folglich nimmt die Varianz signifikant ab, wenn λ zunimmt, und die Vorspannung im Ergebnis nimmt ebenfalls zu. Lasso ist auch ein nützliches Werkzeug, um alle Variablen zu entfernen, die irrelevant sind und nicht mit der Antwortvariablen zusammenhängen.

LASSO in statistischen linearen Modellen

Ein statistisches Modell ist eine reale mathematische Darstellung eines Problems. Das Modell sollte das Problem so nah wie möglich an der realen Welt ausdrücken und es gleichzeitig einfach und leicht verständlich machen. Ein Modell besteht aus Erklärungs- und Antwortvariablen.

Die erklärende Variable ist eine unabhängige Variable, die im Ermessen des Forschers liegt. Die unabhängigen Variablen sind die Eingaben im Modell, die vom Forscher gemessen werden können, um ihre Auswirkung auf die Ergebnisse des Modells zu bestimmen.

Die Antwortvariable ist eine abhängige Variable. Abhängige Variable Eine abhängige Variable ändert sich abhängig vom Wert einer anderen Variablen, der unabhängigen Variablen. das bildet den Schwerpunkt des Experiments. Es bildet das Ergebnis des Experiments, das bei univariaten Modellen ein einzelnes Ergebnis oder bei multivariaten Modellen mehrere Ergebnisse sein kann.

LASSO ist ein wesentlicher Bestandteil des Modellbildungsprozesses, insbesondere unter Verwendung der Merkmalsauswahl. Die Merkmalsauswahlphase hilft bei der Auswahl erklärender Variablen, bei denen es sich um die unabhängigen Variablen und damit um die Eingabevariablen im Modell handelt.

Die Eingabevariablen sind wichtige Elemente, die die Ausgabe des Modells bestimmen und bei der Messung ihrer Auswirkung auf die Antwortvariablen helfen. Die Auswahl der richtigen Variablen bestimmt die Genauigkeit des Modells. Die Funktionsauswahlphase des LASSO hilft bei der richtigen Auswahl der Variablen.

Schätzung mit LASSO

Statistische Modelle basieren auf LASSO für eine genaue Variablenauswahl und Regularisierung. Bei der linearen Regression Regressionsanalyse Die Regressionsanalyse ist eine Reihe statistischer Methoden zur Schätzung der Beziehungen zwischen einer abhängigen Variablen und einer oder mehreren unabhängigen Variablen. Es kann verwendet werden, um die Stärke der Beziehung zwischen Variablen zu bewerten und die zukünftige Beziehung zwischen ihnen zu modellieren. Beispielsweise führt LASSO eine Obergrenze für die Summe der Quadrate ein, wodurch die im Modell vorhandenen Fehler minimiert werden. Der LASSO-Schätzer hängt vom Parameter λ ab.

Der Parameter λ steuert die Stärke der Schrumpfung, wobei eine Zunahme von λ zu einer Zunahme der Schrumpfung führt. Die Obergrenze der Summe aller Koeffizienten ist umgekehrt proportional zum Parameter λ. Wenn der Wert der Obergrenze zunimmt, nimmt der Parameter λ ab. Wenn die Obergrenze abnimmt, nimmt gleichzeitig der Parameter λ zu.

Wenn die Obergrenze gegen unendlich ansteigt, nähert sich der Parameter λ Null und wandelt das Experiment in gewöhnliche kleinste Quadrate um, wobei der Parameter λ immer gleich Null ist. Wenn sich die Koeffizienten der oberen Grenze Null nähern, steigt der Wert des Parameters λ gegen unendlich an.

LASSO Geometrie

LASSO bildet im Diagramm eine Rautenform für seinen Einschränkungsbereich, wie in der Abbildung unten gezeigt. Die Diamantform enthält Ecken, im Gegensatz zu der Kreisform, die durch Gratregression gebildet wird. Die Nähe des ersten Punktes zur Ecke zeigt, dass das Modell einen Koeffizienten hat, der gleich Null ist.

Der Gratregressionsbeschränkungsbereich bildet eine Kreisform, die keine Ecken enthält, die denen ähnlich sind, die durch den LASSO-Beschränkungsbereich beim Zeichnen gebildet werden. Die Gratregressionskoeffizienten können daher nicht gleich Null sein.

Gewichteter LASSO

Das gewichtete LASSO ist das Ergebnis eines Forschers, der die Regressionskoeffizienten isoliert bestraft. Dies bedeutet, dass anstatt einen gemeinsamen Parameter λ für alle Koeffizienten zu bestrafen, die Koeffizienten einzeln unter Verwendung verschiedener Parameter bestraft werden.

Die Gewichte können unter Verwendung eines LASSO-Algorithmus bestimmt werden, um Gewichte für eine genaue Modellierung angemessen zuzuweisen. Eine ähnliche Gewichtung von Regressionskoeffizienten ist das kooperative LASSO, bei dem die Koeffizienten in Gruppen bestraft werden, die als ähnlich gelten.

Zusätzliche Ressourcen

Finance ist der offizielle Anbieter der Certified Banking & Credit Analyst (CBCA) ™ CBCA ™ -Zertifizierung. Die Certified Banking & Credit Analyst (CBCA) ™ -Akkreditierung ist ein globaler Standard für Kreditanalysten, der Finanzen, Rechnungswesen, Kreditanalyse, Cashflow-Analyse, Covenant-Modellierung, Kreditrückzahlungen und mehr. Zertifizierungsprogramm, das jeden in einen erstklassigen Finanzanalysten verwandeln soll.

Um Ihr Wissen über Finanzanalysen weiter zu erlernen und weiterzuentwickeln, empfehlen wir die folgenden zusätzlichen Finanzressourcen:

  • Prognosemethoden Prognosemethoden Top-Prognosemethoden. In diesem Artikel werden vier Arten von Methoden zur Umsatzprognose erläutert, mit denen Finanzanalysten zukünftige Umsätze vorhersagen.
  • Unabhängige Variable Unabhängige Variable Eine unabhängige Variable ist eine Eingabe, Annahme oder ein Treiber, der geändert wird, um die Auswirkungen auf eine abhängige Variable (das Ergebnis) zu bewerten.
  • Multiple lineare Regression Multiple lineare Regression Multiple lineare Regression bezieht sich auf eine statistische Technik, die verwendet wird, um das Ergebnis einer abhängigen Variablen basierend auf dem Wert unabhängiger Variablen vorherzusagen
  • Szenarioanalyse Szenarioanalyse Die Szenarioanalyse ist eine Technik zur Analyse von Entscheidungen durch Spekulation verschiedener möglicher Ergebnisse bei Finanzinvestitionen. In der Finanzmodellierung ist dies

Empfohlen

Was ist das Analystenforum?
Was ist subjektive Wahrscheinlichkeit?
Was ist eine Ausfallrisikoprämie?