Was ist das angepasste R-Quadrat?

Das angepasste R-Quadrat ist eine modifizierte Version des R-Quadrats, die Prädiktoren berücksichtigt, die in einem Regressionsmodell nicht signifikant sind. Mit anderen Worten, das angepasste R-Quadrat zeigt, ob das Hinzufügen zusätzlicher Prädiktoren ein Regressionsmodell verbessert oder nicht. Um das angepasste R-Quadrat zu verstehen, ist ein Verständnis des R-Quadrats erforderlich.

Zusammenfassung:

  • Das angepasste R-Quadrat ist eine modifizierte Version des R-Quadrats, die sich an Prädiktoren anpasst, die in einem Regressionsmodell nicht signifikant sind.
  • Im Vergleich zu einem Modell mit zusätzlichen Eingabevariablen zeigt ein niedrigeres angepasstes R-Quadrat an, dass die zusätzlichen Eingabevariablen dem Modell keinen Mehrwert verleihen.
  • Im Vergleich zu einem Modell mit zusätzlichen Eingabevariablen zeigt ein höher angepasstes R-Quadrat an, dass die zusätzlichen Eingabevariablen dem Modell einen Mehrwert verleihen.

Was ist das R-Quadrat?

Das R-Quadrat, auch Bestimmungskoeffizient genannt, Bestimmungskoeffizient Ein Bestimmungskoeffizient (R² oder r-Quadrat) ist ein statistisches Maß in einem Regressionsmodell, das den Anteil der Varianz in der abhängigen Person bestimmt Welche Eingangsvariablen (Prädiktorvariablen) erklären die Variation der Ausgangsvariablen (Prädiktorvariablen)? Sie reicht von 0 bis 1. Wenn beispielsweise das R-Quadrat 0,9 beträgt, bedeutet dies, dass 90% der Variation der Ausgangsvariablen durch die Eingangsvariablen erklärt werden. Im Allgemeinen zeigt ein höheres R-Quadrat eine bessere Anpassung an das Modell an. Betrachten Sie das folgende Diagramm:

R-Quadrat angepasst

Die blaue Linie bezieht sich auf die Linie der besten Anpassung und zeigt die Beziehung zwischen Variablen. Die Linie wird durch Regressionsanalyse berechnet. Regressionsanalyse Die Regressionsanalyse ist eine Reihe statistischer Methoden, die zur Schätzung der Beziehungen zwischen einer abhängigen Variablen und einer oder mehreren unabhängigen Variablen verwendet werden. Es kann verwendet werden, um die Stärke der Beziehung zwischen Variablen zu bewerten und die zukünftige Beziehung zwischen ihnen zu modellieren. und wird dort aufgetragen, wo die vertikalen Abstände (blau gepunktete Linien) der gelben Punkte zur Linie der besten Anpassung minimiert werden.

Die gelben Punkte beziehen sich auf die Darstellung der Eingabe- und Ausgabevariablen. Die Eingangsvariable ist auf der x-Achse aufgetragen, während die Ausgangsvariable auf der y-Achse aufgetragen ist. Das obige Diagramm besteht beispielsweise aus dem folgenden Datensatz:

Angepasstes R-Quadrat - Diagrammdaten

Die blau gepunkteten Linien beziehen sich auf den Abstand des Diagramms der Eingabe- und Ausgabevariablen von der Linie der besten Anpassung. Das R-Quadrat wird aus dem Abstand aller gelben Punkte von der Linie der besten Anpassung (der blauen Linie) abgeleitet. Das folgende Diagramm würde beispielsweise ein R-Quadrat von 1 veranschaulichen:

R-Quadrat 1

Probleme mit dem R-Quadrat

Das R-Quadrat ist mit einem inhärenten Problem verbunden. Durch zusätzliche Eingangsvariablen bleibt das R-Quadrat gleich oder nimmt zu (dies liegt daran, wie das R-Quadrat mathematisch berechnet wird). Selbst wenn die zusätzlichen Eingabevariablen keine Beziehung zu den Ausgabevariablen aufweisen, erhöht sich daher das R-Quadrat. Ein Beispiel, das ein solches Ereignis erklärt, ist unten angegeben.

Das angepasste R-Quadrat verstehen

Im Wesentlichen untersucht das angepasste R-Quadrat, ob zusätzliche Eingabevariablen zum Modell beitragen. Betrachten Sie ein Beispiel mit Daten, die von einem Pizzabesitzer gesammelt wurden (siehe unten):

Beispieldaten

Angenommen, der Pizzabesitzer führt zwei Regressionen durch:

Regression 1: Preis des Teigs (Eingabevariable), Preis der Pizza (Ausgabevariable)

Regression 1 ergibt ein R-Quadrat von 0,9557 und ein angepasstes R-Quadrat von 0,9493.

Regression 2: Temperatur (Eingangsvariable 1), Teigpreis (Eingangsvariable 2), Pizza-Preis (Ausgangsvariable)

Die Regression 2 ergibt ein R-Quadrat von 0,9573 und ein angepasstes R-Quadrat von 0,9431.

Obwohl die Temperatur keine Vorhersagekraft auf den Preis einer Pizza ausüben sollte, stieg das R-Quadrat von 0,9557 (Regression 1) auf 0,9573 (Regression 2). Eine Person kann glauben, dass Regression 2 eine höhere Vorhersagekraft besitzt, da das R-Quadrat höher ist. Obwohl die Eingangsvariable der Temperatur für die Vorhersage des Preises einer Pizza unbrauchbar ist, erhöht sie das R-Quadrat. Hier kommt das angepasste R-Quadrat ins Spiel.

Das angepasste R-Quadrat untersucht, ob zusätzliche Eingabevariablen zum Modell beitragen. Das angepasste R-Quadrat in Regression 1 betrug 0,9493 im Vergleich zu dem angepassten R-Quadrat in Regression 2 von 0,9493. Daher kann das angepasste R-Quadrat erkennen, dass die Eingangsvariable der Temperatur bei der Erklärung der Ausgangsvariablen (des Preises einer Pizza) nicht hilfreich ist. In einem solchen Fall würde das angepasste R-Quadrat den Modellersteller darauf hinweisen, Regression 1 anstelle von Regression 2 zu verwenden.

Beispiel für das angepasste R-Quadrat

Betrachten Sie zwei Modelle:

  • Modell 1 verwendet die Eingangsvariablen X1, X2 und X3, um Y1 vorherzusagen.
  • Modell 2 verwendet die Eingangsvariablen X1 und X2, um Y1 vorherzusagen.

Welches Modell soll verwendet werden? Informationen zu beiden Modellen finden Sie unten:

Beispiel

Beim Vergleich des R-Quadrats zwischen Modell 1 und Modell 2 sagt das R-Quadrat voraus, dass Modell 1 ein besseres Modell ist, da es eine größere Erklärungskraft besitzt (0,5923 in Modell 1 gegenüber 0,5612 in Modell 2).

Beim Vergleich des R-Quadrats zwischen Modell 1 und Modell 2 sagt das angepasste R-Quadrat voraus, dass die Eingangsvariable X3 zur Erklärung der Ausgangsvariablen Y1 beiträgt (0,4231 in Modell 1 gegenüber 0,3512 in Modell 2).

Daher sollte Modell 1 verwendet werden, da die zusätzliche Eingangsvariable X3 zur Erklärung der Ausgangsvariablen Y1 beiträgt.

Zusätzliche Ressourcen

Finance bietet die FMVA® ™ FMVA®-Zertifizierung (Financial Modeling & Valuation Analyst) an. Schließen Sie sich mehr als 350.600 Studenten an, die für Unternehmen wie Amazon, JP Morgan und Ferrari arbeiten, um ihre Karriere auf die nächste Stufe zu heben. Die folgenden Finanzressourcen sind hilfreich, um weiter zu lernen und Ihre Karriere voranzutreiben:

  • Grundlegende Statistikkonzepte für Finanzen Grundlegende Statistikkonzepte für Finanzen Ein solides Verständnis der Statistik ist von entscheidender Bedeutung, um das Finanzverständnis besser zu verstehen. Darüber hinaus können statistische Konzepte den Anlegern bei der Überwachung helfen
  • High-Low-Methode vs. Regressionsanalyse High-Low-Methode vs. Regressionsanalyse Die High-Low-Methode und die Regressionsanalyse sind die beiden Hauptmethoden zur Kostenschätzung, mit denen die Beträge der festen und variablen Kosten geschätzt werden. Normalerweise müssen Manager gemischte Kosten in ihre festen und variablen Komponenten aufteilen, um die Zukunft vorherzusagen und zu planen.
  • Unabhängige Variable Unabhängige Variable Eine unabhängige Variable ist eine Eingabe, Annahme oder ein Treiber, der geändert wird, um die Auswirkungen auf eine abhängige Variable (das Ergebnis) zu bewerten.
  • Arten der Finanzanalyse Arten der Finanzanalyse Bei der Finanzanalyse werden Finanzdaten verwendet, um die Leistung eines Unternehmens zu bewerten und Empfehlungen abzugeben, wie es sich in Zukunft verbessern kann. Finanzanalysten führen ihre Arbeit hauptsächlich in Excel aus und verwenden eine Tabelle, um historische Daten zu analysieren und Prognosen zu erstellen. Arten der Finanzanalyse

Empfohlen

Was ist das Gesetz eines Preises (LOOP)?
Was ist Tauschhandel?
Was ist eine Veräußerung?