Was ist der Bestimmungskoeffizient?

Der Bestimmungskoeffizient (R² oder r-Quadrat) ist ein statistisches Maß in einem Regressionsmodell, das den Varianzanteil in der abhängigen Variablen bestimmt, der durch die unabhängige Variable erklärt werden kann. Unabhängige Variable Eine unabhängige Variable ist eine Eingabe, Annahme oder ein Treiber Dies wird geändert, um die Auswirkungen auf eine abhängige Variable (das Ergebnis) zu bewerten. . Mit anderen Worten, der Bestimmungskoeffizient gibt an, wie gut die Daten zum Modell passen (Anpassungsgüte).

Bestimmtheitsmaß

Obwohl der Bestimmungskoeffizient einige nützliche Erkenntnisse zum Regressionsmodell liefert, sollte man sich bei der Bewertung eines statistischen Modells nicht nur auf das Maß verlassen. Es werden keine Informationen über den Kausalzusammenhang zwischen den unabhängigen und abhängigen Variablen veröffentlicht. Abhängige Variable Eine abhängige Variable ändert sich abhängig vom Wert einer anderen Variablen, der unabhängigen Variablen. und es zeigt nicht die Richtigkeit des Regressionsmodells an. Daher sollte der Benutzer immer Schlussfolgerungen über das Modell ziehen, indem er den Bestimmungskoeffizienten zusammen mit anderen Variablen in einem statistischen Modell analysiert.

Der Bestimmungskoeffizient kann beliebige Werte zwischen 0 und 1 annehmen. Außerdem wird die statistische Metrik häufig in Prozent ausgedrückt.

Interpretation des Bestimmungskoeffizienten (R²)

Die häufigste Interpretation des Bestimmungskoeffizienten ist, wie gut das Regressionsmodell zu den beobachteten Daten passt. Ein Bestimmungskoeffizient von 60% zeigt beispielsweise, dass 60% der Daten zum Regressionsmodell passen. Im Allgemeinen zeigt ein höherer Koeffizient eine bessere Anpassung an das Modell an.

Es ist jedoch nicht immer der Fall, dass ein hohes r-Quadrat für das Regressionsmodell gut ist. Die Qualität des Koeffizienten hängt von mehreren Faktoren ab, einschließlich der Maßeinheiten der Variablen, der Art der im Modell verwendeten Variablen und der angewandten Datentransformation. Daher kann manchmal ein hoher Koeffizient auf Probleme mit dem Regressionsmodell hinweisen.

Keine universelle Regel regelt, wie der Bestimmungskoeffizient in die Bewertung eines Modells einbezogen wird. Der Kontext, auf dem die Prognose oder das Experiment basiert, ist äußerst wichtig, und in verschiedenen Szenarien können die Erkenntnisse aus der statistischen Metrik variieren.

Berechnung des Koeffizienten

Mathematisch kann der Bestimmungskoeffizient nach folgender Formel ermittelt werden:

Formel

Wo:

  • SS- Regression - die Summe der Quadrate aufgrund der Regression (erklärte Summe der Quadrate)
  • SS total - die Gesamtsumme der Quadrate

Obwohl die Begriffe "Gesamtsumme der Quadrate" und "Summe der Quadrate aufgrund von Regression" verwirrend erscheinen, sind die Bedeutungen der Variablen einfach.

Die Gesamtsumme der Quadrate misst die Variation der beobachteten Daten (Daten, die bei der Regressionsmodellierung verwendet werden). Die Summe der Quadrate aufgrund von Regression misst, wie gut das Regressionsmodell die Daten darstellt, die für die Modellierung verwendet wurden.

Mehr Ressourcen

Finance ist der offizielle Anbieter der globalen FMVA®-Zertifizierung (Financial Modeling & Valuation Analyst). Schließen Sie sich mehr als 350.600 Studenten an, die für Unternehmen wie Amazon, JP Morgan und Ferrari arbeiten, um jedem zu helfen, ein erstklassiger Finanzanalyst zu werden . Um weiter zu lernen und Ihre Karriere voranzutreiben, sind die folgenden zusätzlichen Finanzressourcen hilfreich:

  • Grundlegende Statistikkonzepte im Finanzwesen Grundlegende Statistikkonzepte für das Finanzwesen Ein solides Verständnis der Statistik ist von entscheidender Bedeutung, um das Finanzwesen besser zu verstehen. Darüber hinaus können statistische Konzepte den Anlegern bei der Überwachung helfen
  • Binomialverteilung Binomialverteilung Die Binomialverteilung ist eine übliche Wahrscheinlichkeitsverteilung, die die Wahrscheinlichkeit modelliert, eines von zwei Ergebnissen unter einer bestimmten Anzahl von Parametern zu erhalten
  • Zentraler Grenzwertsatz Zentraler Grenzwertsatz Der zentrale Grenzwertsatz besagt, dass der Stichprobenmittelwert einer Zufallsvariablen eine nahezu normale oder normale Verteilung annimmt, wenn die Stichprobengröße groß ist
  • Regressionsanalyse Regressionsanalyse Die Regressionsanalyse ist eine Reihe statistischer Methoden zur Schätzung der Beziehungen zwischen einer abhängigen Variablen und einer oder mehreren unabhängigen Variablen. Es kann verwendet werden, um die Stärke der Beziehung zwischen Variablen zu bewerten und die zukünftige Beziehung zwischen ihnen zu modellieren.

Empfohlen

Was ist das nordamerikanische Freihandelsabkommen (NAFTA)?
Was ist eine Unternehmensreorganisationsklausel?
Was ist ein Haushalt?