Was ist multiple lineare Regression?

Multiple lineare Regression bezieht sich auf eine statistische Technik, mit der das Ergebnis einer Variablen basierend auf dem Wert von zwei oder mehr Variablen vorhergesagt wird. Es wird manchmal einfach als multiple Regression bezeichnet und ist eine Erweiterung der linearen Regression. Die Variable, die wir vorhersagen möchten, wird als abhängige Variable bezeichnet, während die Variablen, mit denen wir den Wert der abhängigen Variablen vorhersagen. Abhängige Variable Eine abhängige Variable ändert sich abhängig vom Wert einer anderen Variablen, der unabhängigen Variablen. sind als unabhängige oder erklärende Variablen bekannt.

Multiple lineare RegressionAbbildung 1: Vorhersagen mehrerer linearer Regressionsmodelle für einzelne Beobachtungen (Quelle)

Zusammenfassung

  • Multiple lineare Regression bezieht sich auf eine statistische Technik, bei der zwei oder mehr unabhängige Variablen verwendet werden, um das Ergebnis einer abhängigen Variablen vorherzusagen.
  • Die Technik ermöglicht es Analysten, die Variation des Modells und den relativen Beitrag jeder unabhängigen Variablen zur Gesamtvarianz zu bestimmen.
  • Die multiple Regression kann zwei Formen annehmen, nämlich die lineare Regression und die nichtlineare Regression.

Multiple lineare Regressionsformel

Multiple lineare Regression - Formel

Wo:

  • yi ist die abhängige Variable oder vorhergesagt
  • β0 ist der y- Achsenabschnitt , dh der Wert von y, wenn sowohl xi als auch x2 0 sind.
  • β1 und β2 sind die Regressionskoeffizienten, die die Änderung von y relativ zu einer Änderung von xi1 bzw. xi2 um eine Einheit darstellen.
  • βp ist der Steigungskoeffizient für jede unabhängige Variable
  • ϵ ist der zufällige Fehlerterm (Rest) des Modells.

Grundlegendes zur multiplen linearen Regression

Durch die einfache lineare Regression können Statistiker den Wert einer Variablen anhand der verfügbaren Informationen zu einer anderen Variablen vorhersagen. Die lineare Regression versucht, die Beziehung zwischen den beiden Variablen entlang einer geraden Linie herzustellen.

Multiple Regression ist eine Art von Regression, bei der die abhängige Variable eine lineare Beziehung zu zwei oder mehr unabhängigen Variablen aufweist. Es kann auch nichtlinear sein , wobei die abhängigen und unabhängigen Variablen Unabhängige Variable Eine unabhängige Variable ist eine Eingabe, Annahme oder ein Treiber, der geändert wird, um ihre Auswirkungen auf eine abhängige Variable (das Ergebnis) zu bewerten. Folgen Sie nicht einer geraden Linie.

Sowohl die lineare als auch die nichtlineare Regression verfolgen eine bestimmte Antwort mithilfe von zwei oder mehr Variablen grafisch. Eine nichtlineare Regression ist jedoch normalerweise schwierig auszuführen, da sie aus Annahmen erstellt wird, die aus Versuch und Irrtum abgeleitet wurden.

Annahmen der multiplen linearen Regression

Die multiple lineare Regression basiert auf folgenden Annahmen:

1. Eine lineare Beziehung zwischen den abhängigen und unabhängigen Variablen

Die erste Annahme einer multiplen linearen Regression ist, dass zwischen der abhängigen Variablen und jeder der unabhängigen Variablen eine lineare Beziehung besteht. Der beste Weg, um die linearen Beziehungen zu überprüfen, besteht darin, Streudiagramme zu erstellen und die Streudiagramme dann visuell auf Linearität zu untersuchen. Wenn die im Streudiagramm angezeigte Beziehung nicht linear ist, muss der Analyst eine nichtlineare Regression ausführen oder die Daten mithilfe einer statistischen Software wie SPSS transformieren.

2. Die unabhängigen Variablen sind nicht stark miteinander korreliert

Die Daten sollten keine Multikollinearität aufweisen, die auftritt, wenn die unabhängigen Variablen (erklärende Variablen) stark miteinander korreliert sind. Wenn unabhängige Variablen Multikollinearität zeigen, gibt es Probleme beim Herausfinden der spezifischen Variablen, die zur Varianz in der abhängigen Variablen beiträgt. Die beste Methode, um die Annahme zu testen, ist die Varianzinflationsfaktor-Methode.

3. Die Varianz der Residuen ist konstant

Bei der multiplen linearen Regression wird davon ausgegangen, dass die Fehlermenge in den Residuen an jedem Punkt des linearen Modells ähnlich ist. Dieses Szenario wird als Homoskedastizität bezeichnet. Bei der Analyse der Daten sollte der Analyst die standardisierten Residuen gegen die vorhergesagten Werte zeichnen, um festzustellen, ob die Punkte fair über alle Werte unabhängiger Variablen verteilt sind. Um die Annahme zu testen, können die Daten in einem Streudiagramm oder mithilfe einer statistischen Software aufgezeichnet werden, um ein Streudiagramm zu erstellen, das das gesamte Modell enthält.

4. Unabhängigkeit der Beobachtung

Das Modell geht davon aus, dass die Beobachtungen unabhängig voneinander sein sollten. Einfach ausgedrückt geht das Modell davon aus, dass die Werte der Residuen unabhängig sind. Um diese Annahme zu testen, verwenden wir die Durbin Watson-Statistik.

Der Test zeigt Werte von 0 bis 4, wobei ein Wert von 0 bis 2 eine positive Autokorrelation und Werte von 2 bis 4 eine negative Autokorrelation zeigen. Der Mittelpunkt, dh ein Wert von 2, zeigt, dass keine Autokorrelation vorliegt.

5. Multivariate Normalität

Multivariate Normalität tritt auf, wenn Residuen normal verteilt sind. Um diese Annahme zu testen, schauen Sie sich an, wie die Werte der Residuen verteilt sind. Es kann auch mit zwei Hauptmethoden getestet werden, dh einem Histogramm mit einer überlagerten Normalkurve oder der Normalwahrscheinlichkeitsdiagrammmethode.

Mehr Ressourcen

Finance bietet die CBCA-Zertifizierung (Certified Banking & Credit Analyst) an. Die CBCA-Akkreditierung (Certified Banking & Credit Analyst) ist ein globaler Standard für Kreditanalysten, der Finanzen, Rechnungswesen, Kreditanalyse, Cashflow-Analyse, Covenant-Modellierung und Darlehen umfasst Rückzahlungen und mehr. Zertifizierungsprogramm für diejenigen, die ihre Karriere auf die nächste Stufe bringen möchten. Um weiter zu lernen und Ihre Wissensbasis weiterzuentwickeln, lesen Sie bitte die folgenden zusätzlichen relevanten Finanzressourcen:

  • Prognosemethoden Prognosemethoden Top-Prognosemethoden. In diesem Artikel werden vier Arten von Methoden zur Umsatzprognose erläutert, mit denen Finanzanalysten zukünftige Umsätze vorhersagen.
  • Poisson-Verteilung Poisson-Verteilung Die Poisson-Verteilung ist ein Werkzeug, das in der Wahrscheinlichkeitstheorie-Statistik verwendet wird, um das Ausmaß der Abweichung von einer bekannten durchschnittlichen Auftrittsrate innerhalb vorherzusagen
  • Zufallsvariable Zufallsvariable Eine Zufallsvariable (stochastische Variable) ist eine Art von Variable in der Statistik, deren mögliche Werte von den Ergebnissen eines bestimmten Zufallsphänomens abhängen
  • Regressionsanalyse Regressionsanalyse Die Regressionsanalyse ist eine Reihe statistischer Methoden zur Schätzung der Beziehungen zwischen einer abhängigen Variablen und einer oder mehreren unabhängigen Variablen. Es kann verwendet werden, um die Stärke der Beziehung zwischen Variablen zu bewerten und die zukünftige Beziehung zwischen ihnen zu modellieren.

Empfohlen

Was ist eine Reiserichtlinie?
Stunden und Arbeitsbelastung der Finanzanalysten
Was ist variable Annuitisierung?