Was ist der Varianzinflationsfaktor (VIF)?

Der Varianzinflationsfaktor (VIF) misst den Schweregrad der Multikollinearität in der Regressionsanalyse. Regressionsanalyse Die Regressionsanalyse ist eine Reihe statistischer Methoden zur Schätzung der Beziehungen zwischen einer abhängigen Variablen und einer oder mehreren unabhängigen Variablen. Es kann verwendet werden, um die Stärke der Beziehung zwischen Variablen zu bewerten und die zukünftige Beziehung zwischen ihnen zu modellieren. . Es ist ein statistisches Konzept, das die Zunahme der Varianz eines Regressionskoeffizienten infolge der Kollinearität anzeigt.

Varianzinflationsfaktor

Zusammenfassung

  • Der Varianzinflationsfaktor (VIF) wird verwendet, um den Schweregrad der Multikollinearität in der gewöhnlichen Regressionsanalyse des kleinsten Quadrats (OLS) zu ermitteln.
  • Multikollinearität erhöht die Varianz und den Typ-II-Fehler. Es macht den Koeffizienten einer Variablen konsistent, aber unzuverlässig.
  • VIF misst die Anzahl der durch Multikollinearität verursachten aufgeblasenen Varianzen.

Varianzinflationsfaktor und Multikollinearität

Bei der gewöhnlichen Regressionsanalyse der kleinsten Quadrate (OLS) liegt Multikollinearität vor, wenn zwei oder mehr der unabhängigen Variablen unabhängige Variable Eine unabhängige Variable ist eine Eingabe, Annahme oder ein Treiber, der geändert wird, um ihre Auswirkungen auf eine abhängige Variable (das Ergebnis) zu bewerten. . zeigen eine lineare Beziehung zwischen ihnen. Um beispielsweise das Verhältnis von Unternehmensgröße und Umsatz zu Aktienkursen in einem Regressionsmodell zu analysieren, sind Marktkapitalisierung und Umsatz die unabhängigen Variablen.

Marktkapitalisierung eines Unternehmens Marktkapitalisierung Die Marktkapitalisierung (Market Cap) ist der jüngste Marktwert der ausstehenden Aktien eines Unternehmens. Die Marktkapitalisierung entspricht dem aktuellen Aktienkurs multipliziert mit der Anzahl der ausgegebenen Aktien. Die Investorengemeinschaft verwendet häufig den Marktkapitalisierungswert, um Unternehmen einzustufen, und der Gesamtumsatz ist stark korreliert. Wenn ein Unternehmen steigende Umsätze erzielt, wächst auch seine Größe. Dies führt zu einem Multikollinearitätsproblem in der OLS-Regressionsanalyse. Wenn die unabhängigen Variablen in einem Regressionsmodell eine perfekt vorhersagbare lineare Beziehung aufweisen, spricht man von perfekter Multikollinearität.

Bei Multikollinearität sind die Regressionskoeffizienten immer noch konsistent, aber nicht mehr zuverlässig, da die Standardfehler aufgeblasen sind. Dies bedeutet, dass die Vorhersagekraft des Modells nicht verringert wird, die Koeffizienten jedoch bei einem Typ-II-Fehler möglicherweise nicht statistisch signifikant sind. Typ-II-Fehler Beim statistischen Hypothesentest ist ein Typ-II-Fehler eine Situation, in der ein Hypothesentest die Nullhypothese nicht ablehnt ist falsch. In anderen .

Wenn daher die Koeffizienten von Variablen nicht individuell signifikant sind - im t-Test nicht verworfen werden können -, sondern gemeinsam die Varianz der abhängigen Variablen mit Zurückweisung im F-Test und einem hohen Bestimmungskoeffizienten (R2) erklären können, Multikollinearität könnte existieren. Es ist eine der Methoden zur Erkennung von Multikollinearität.

VIF ist ein weiteres häufig verwendetes Tool, um festzustellen, ob in einem Regressionsmodell Multikollinearität vorliegt. Es misst, wie stark die Varianz (oder der Standardfehler) des geschätzten Regressionskoeffizienten aufgrund der Kollinearität aufgeblasen ist.

Verwendung des Varianzinflationsfaktors

VIF kann nach folgender Formel berechnet werden:

Varianzinflationsfaktor - Formel

Wobei R i 2 den nicht angepassten Bestimmungskoeffizienten für die Regression der i-ten unabhängigen Variablen auf die verbleibenden darstellt. Der Kehrwert von VIF wird als Toleranz bezeichnet . Je nach persönlicher Präferenz kann entweder VIF oder Toleranz verwendet werden, um Multikollinearität zu erkennen.

Wenn R i 2 gleich 0 ist, kann die Varianz der verbleibenden unabhängigen Variablen nicht aus der i-ten unabhängigen Variablen vorhergesagt werden. Wenn daher VIF oder Toleranz gleich 1 ist, ist die i-te unabhängige Variable nicht mit den verbleibenden korreliert, was bedeutet, dass in diesem Regressionsmodell keine Multikollinearität existiert. In diesem Fall wird die Varianz des i-ten Regressionskoeffizienten nicht aufgeblasen.

Im Allgemeinen weist ein VIF über 4 oder eine Toleranz unter 0,25 darauf hin, dass möglicherweise Multikollinearität vorliegt, und weitere Untersuchungen sind erforderlich. Wenn das VIF höher als 10 oder die Toleranz niedriger als 0,1 ist, besteht eine signifikante Multikollinearität, die korrigiert werden muss.

Es gibt jedoch auch Situationen, in denen hohe VFIs ignoriert werden können, ohne an Multikollinearität zu leiden. Das Folgende sind drei solche Situationen:

1. Hohe VIFs existieren nur in Steuervariablen, nicht jedoch in interessierenden Variablen. In diesem Fall sind die interessierenden Variablen nicht zueinander oder zu den Steuervariablen kollinear. Die Regressionskoeffizienten werden nicht beeinflusst.

2. Wenn durch die Einbeziehung der Produkte oder Potenzen anderer Variablen hohe VIFs verursacht werden, verursacht Multikollinearität keine negativen Auswirkungen. Beispielsweise enthält ein Regressionsmodell sowohl x als auch x2 als unabhängige Variablen.

3. Wenn eine Dummy-Variable, die mehr als zwei Kategorien darstellt, eine hohe VIF aufweist, ist Multikollinearität nicht unbedingt vorhanden. Die Variablen haben immer hohe VIFs, wenn es einen kleinen Teil der Fälle in der Kategorie gibt, unabhängig davon, ob die kategorialen Variablen mit anderen Variablen korreliert sind.

Korrektur der Multikollinearität

Da Multikollinearität die Varianz der Koeffizienten erhöht und Fehler vom Typ II verursacht, ist es wichtig, sie zu erkennen und zu korrigieren. Es gibt zwei einfache und häufig verwendete Methoden zur Korrektur der Multikollinearität, wie unten aufgeführt:

1. Die erste besteht darin, eine (oder mehrere) der stark korrelierten Variablen zu entfernen. Da die von den Variablen bereitgestellten Informationen redundant sind, wird der Bestimmungskoeffizient durch das Entfernen nicht stark beeinträchtigt.

2. Die zweite Methode besteht darin, anstelle der OLS-Regression die Hauptkomponentenanalyse (PCA) oder die partielle Regression kleinster Quadrate (PLS) zu verwenden. Die PLS-Regression kann die Variablen auf einen kleineren Satz ohne Korrelation zwischen ihnen reduzieren. In PCA werden neue unkorrelierte Variablen erstellt. Es minimiert den Informationsverlust und verbessert die Vorhersagbarkeit eines Modells.

Mehr Ressourcen

Finance ist der offizielle Anbieter der globalen CBCA-Zertifizierung (Certified Banking & Credit Analyst). Die CBCA-Akkreditierung (Certified Banking & Credit Analyst) ist ein globaler Standard für Kreditanalysten, der Finanzen, Rechnungswesen, Kreditanalyse und Cashflow-Analyse umfasst , Covenant-Modellierung, Kreditrückzahlungen und mehr. Zertifizierungsprogramm, das jedem helfen soll, ein erstklassiger Finanzanalyst zu werden. Um Ihre Karriere weiter voranzutreiben, sind die folgenden zusätzlichen Ressourcen hilfreich:

  • Grundlegende Statistikkonzepte im Finanzwesen Grundlegende Statistikkonzepte für das Finanzwesen Ein solides Verständnis der Statistik ist von entscheidender Bedeutung, um das Finanzwesen besser zu verstehen. Darüber hinaus können statistische Konzepte den Anlegern bei der Überwachung helfen
  • Prognosemethoden Prognosemethoden Top-Prognosemethoden. In diesem Artikel werden vier Arten von Methoden zur Umsatzprognose erläutert, mit denen Finanzanalysten zukünftige Umsätze vorhersagen.
  • Multiple lineare Regression Multiple lineare Regression Die multiple lineare Regression bezieht sich auf eine statistische Technik, mit der das Ergebnis einer abhängigen Variablen basierend auf dem Wert unabhängiger Variablen vorhergesagt wird
  • Zufallsvariable Zufallsvariable Eine Zufallsvariable (stochastische Variable) ist eine Art von Variable in der Statistik, deren mögliche Werte von den Ergebnissen eines bestimmten Zufallsphänomens abhängen

Empfohlen

Was ist das Gesetz eines Preises (LOOP)?
Was ist Tauschhandel?
Was ist eine Veräußerung?