Was ist Elastic Net?

Die elastische lineare Netzregression verwendet die Strafen sowohl der Lasso- als auch der Ridge-Technik, um Regressionsmodelle zu regulieren. Die Technik kombiniert sowohl das Lasso LASSO LASSO, kurz für Least Absolute Shrinkage and Selection Operator, ist eine statistische Formel, deren Hauptzweck die Auswahl und Regularisierung von Merkmalen und die Regression von Graten ist, indem aus ihren Mängeln gelernt wird, um die Regularisierung statistischer Modelle zu verbessern.

Elastisches Netz

Die Methode des elastischen Netzes verbessert die Einschränkungen des Lassos, dh wenn das Lasso einige Proben für hochdimensionale Daten entnimmt, bietet das Verfahren des elastischen Netzes die Einbeziehung der Anzahl "n" von Variablen bis zur Sättigung. In einem Fall, in dem die Variablen stark korrelierte Gruppen sind, neigt Lasso dazu, eine Variable aus solchen Gruppen auszuwählen und den Rest vollständig zu ignorieren.

Um die im Lasso festgestellten Einschränkungen zu beseitigen, enthält das elastische Netz einen quadratischen Ausdruck (|| β || 2) in der Strafe, der, wenn er isoliert verwendet wird, zur Gratregression wird. Der quadratische Ausdruck in der Strafe erhöht die Verlustfunktion in Richtung konvex. Das elastische Netz nutzt das Beste aus beiden Welten - dh die Lasso- und Ridge-Regression.

Bei der Ermittlung des Schätzers der elastischen Netzmethode gibt es zwei Stufen, die sowohl die Lasso- als auch die Regressionstechnik umfassen. Es findet zuerst die Gratregressionskoeffizienten und führt dann den zweiten Schritt durch, indem eine Lasso-Art der Schrumpfung der Koeffizienten verwendet wird.

Dieses Verfahren unterwirft daher die Koeffizienten zwei Arten von Schrumpfungen. Das doppelte Schrumpfen gegenüber der naiven Version des elastischen Netzes führt zu einer geringen Effizienz bei der Vorhersagbarkeit und einer hohen Vorspannung. Um solche Effekte zu korrigieren, werden die Koeffizienten neu skaliert, indem sie mit (1 + λ 2 ) multipliziert werden .

Kurze Zusammenfassung

  • Die elastische Netzmethode führt gleichzeitig eine variable Auswahl und Regularisierung durch.
  • Die elastische Netztechnik ist am besten geeignet, wenn die Dimensionsdaten größer sind als die Anzahl der verwendeten Proben.
  • Die Auswahl von Gruppierungen und Variablen ist die Schlüsselrolle der elastischen Netztechnik.

Elastische Netzgeometrie

Wenn das elastische Netz auf einer kartesischen Ebene dargestellt wird, liegt es zwischen den Grat- und Lasso-Regressionskurven, da es die Kombination dieser beiden Regressionsmethoden ist. Die Darstellung für das elastische Netz zeigt auch Singularität an den Eckpunkten, die für die Sparsity wichtig sind. Es zeigt auch strenge konvexe Kanten, bei denen die Konvexität vom Wert von α abhängt.

Die Konvexität hängt auch vom Gruppierungseffekt ab, der von der Korrelation abhängt. Korrelation Eine Korrelation ist ein statistisches Maß für die Beziehung zwischen zwei Variablen. Das Maß wird am besten in Variablen verwendet, die eine lineare Beziehung untereinander aufweisen. Die Anpassung der Daten kann in einem Streudiagramm visuell dargestellt werden. der ausgewählten Variablen. Je höher die Korrelation der Variablen ist, desto höher ist der Gruppierungseffekt und damit die Anzahl der in der Stichprobe enthaltenen Variablen.

Variablenauswahl

Die Modellbildung erfordert die Auswahl von Variablen, um eine Teilmenge von Prädiktoren zu bilden. Elastic Net verwendet den p >> n-Problemansatz, was bedeutet, dass die Anzahl der Prädiktorenzahlen höher ist als die Anzahl der im Modell verwendeten Stichproben. Das elastische Netz ist geeignet, wenn die Variablen Gruppen bilden, die stark korrelierte unabhängige Variablen enthalten. Unabhängige Variable Eine unabhängige Variable ist eine Eingabe, Annahme oder ein Treiber, der geändert wird, um ihre Auswirkungen auf eine abhängige Variable (das Ergebnis) zu bewerten. .

Die Variablenauswahl wird in das Modellierungsverfahren einbezogen, um die Genauigkeit zu erhöhen. Wenn eine Gruppe von Variablen stark korreliert ist und eine der Variablen in die Stichprobe aufgenommen wird, wird die gesamte Gruppe automatisch in die Stichprobe aufgenommen.

CATREG Incorporation

CATREG ist ein Algorithmus, der die lineare und nichtlineare Variablentransformation erleichtert. Der Algorithmus verwendet Schritt- und Spline-Funktionen zum Transformieren von Variablen entweder nicht monoton oder monoton in nichtlinearen Transformationen. CATREG kann Variablen gleichzeitig nicht monoton transformieren und regulieren, ohne dass zuerst Variablen in Grundfunktionen oder Dummy-Variablen erweitert werden müssen.

Elastische Nettoverlustfunktionen können auch als eingeschränkter Typ der gewöhnlichen Regressionsverlustfunktion der kleinsten Quadrate bezeichnet werden. Der CATREG-Algorithmus ist in das elastische Netz integriert, wodurch die Effizienz und Einfachheit des resultierenden Algorithmus verbessert wird. Im Vergleich dazu übertrifft das elastische Netz das Lasso, das selbst die Gratregression in Bezug auf Effizienz und Einfachheit übertrifft.

Elastic Net Regularization

Während des Regularisierungsverfahrens bildet der l 1 -Abschnitt der Strafe ein spärliches Modell. Auf der anderen Seite macht der quadratische Abschnitt der Strafe des l 1 Teil stabiler in dem Pfad zur Regularisierung eliminiert die Mengengrenze von Variablen ausgewählt werden, und fördert die Gruppierungs Wirkung.

Durch den Gruppierungseffekt können die Variablen mithilfe der Korrelation leicht identifiziert werden. Dies verbessert das Probenahmeverfahren. Es erhöht auch die Anzahl der ausgewählten Variablen, da bei der Stichprobe einer Variablen in einer stark korrelierten Gruppe alle anderen Variablen in dieser Gruppe automatisch zur Stichprobe hinzugefügt werden.

Effektive Freiheitsgrade

Effektive Freiheitsgrade messen die Komplexität eines Modells. Freiheitsgrade sind wichtig für die Schätzung oder die genaue Vorhersage einer Modellanpassung. Freiheitsgrade fließen auch in das Lernen linearer Glätter ein. Bei jeder Methode im Zusammenhang mit der l 1- Strafe wirft die nichtlineare Natur der Modelle die Herausforderung in der Analyse auf.

Das elastische Netz kann auch in anderen Anwendungen verwendet werden, z. B. in PCA mit geringer Dichte, wo es Hauptkomponenten erhält, die durch spärliche Belastungen modifiziert werden. Die andere Anwendung ist das elastische Kernelnetz, in dem die Erzeugung von Klassenkernmaschinen mit Unterstützungsvektoren erfolgt.

Zusätzliche Ressourcen

Finance bietet die CBCA-Zertifizierung (Certified Banking & Credit Analyst) an. Die CBCA-Akkreditierung (Certified Banking & Credit Analyst) ist ein globaler Standard für Kreditanalysten, der Finanzen, Rechnungswesen, Kreditanalyse, Cashflow-Analyse, Covenant-Modellierung und Darlehen umfasst Rückzahlungen und mehr. Zertifizierungsprogramm für diejenigen, die ihre Karriere auf die nächste Stufe bringen möchten. Um weiter zu lernen und Ihre Wissensbasis weiterzuentwickeln, lesen Sie bitte die folgenden zusätzlichen relevanten Finanzressourcen:

  • Entscheidungsbaum Entscheidungsbaum Ein Entscheidungsbaum ist ein Unterstützungswerkzeug mit einer baumartigen Struktur, das wahrscheinliche Ergebnisse, Kosten von Ressourcen, Dienstprogramme und mögliche Konsequenzen modelliert.
  • Abhängige Variable Abhängige Variable Eine abhängige Variable ändert sich abhängig vom Wert einer anderen Variablen, der unabhängigen Variablen.
  • Multiple lineare Regression Multiple lineare Regression Die multiple lineare Regression bezieht sich auf eine statistische Technik, mit der das Ergebnis einer abhängigen Variablen basierend auf dem Wert unabhängiger Variablen vorhergesagt wird
  • Überanpassung Überanpassung Überanpassung ist ein Begriff, der in Statistiken verwendet wird und sich auf einen Modellierungsfehler bezieht, der auftritt, wenn eine Funktion einem bestimmten Datensatz zu genau entspricht

Empfohlen

Was ist die MAXIFS-Funktion?
Was sind Bankenklassen?
Über die Goldman Sachs Group