Was ist nichtparametrische Statistik?

Nichtparametrische Statistiken sind Methoden, mit denen statistische Rückschlüsse unabhängig von der zugrunde liegenden Verteilung gezogen werden können. Die Methode passt ohne Annahmen zu einer Normalverteilung. Gewohnheitsmäßig verwendet der Ansatz Daten, bei denen es sich häufig um ordinale Ordnungsdaten handelt. In der Statistik sind Ordnungsdaten die Art von Daten, bei denen die Werte einer natürlichen Reihenfolge folgen. Eines der bemerkenswertesten Merkmale von Ordnungsdaten ist, dass sie sich eher auf Rangfolgen als auf Zahlen stützen.

Nichtparametrische Statistik

Nichtparametrische Statistiken können mit parametrischen Statistiken verglichen werden. Der letztere Ansatz macht explizite Annahmen über die Verteilung der beobachteten Daten und schätzt die Parameter der Verteilung unter Verwendung derselben Daten.

Zusammenfassung

  • Nichtparametrische Statistiken sind eine Methode, bei der zugrunde liegende Verteilungen bei statistischen Schlussfolgerungen nicht berücksichtigt werden.
  • Nichtparametrische statistische Methoden zielen darauf ab, die unbekannte zugrunde liegende Verteilung der beobachteten Daten zu ermitteln und in Abwesenheit der zugrunde liegenden Verteilung einen statistischen Rückschluss zu ziehen.
  • Den Forschern wird empfohlen, Schwächen, Stärken und mögliche Fallstricke nichtparametrischer Statistiken zu berücksichtigen.

Grundlegendes zu nichtparametrischen Statistiken

Betrachten Sie die Daten mit unbekannten Parametern µ (Mittelwert) und σ2 (Varianz). Während parametrische Statistiken davon ausgehen, dass die Daten aus einer Normalverteilung stammen. Normalverteilung Die Normalverteilung wird auch als Gaußsche oder Gaußsche Verteilung bezeichnet. Diese Art der Verbreitung ist in den Natur- und Sozialwissenschaften weit verbreitet. Eine nichtparametrische Statistik geht nicht davon aus, dass die Daten normal verteilt oder quantitativ sind. In dieser Hinsicht würde eine nichtparametrische Statistik die Form der Verteilung selbst schätzen, anstatt die einzelnen µ und σ2 zu schätzen.

Andererseits würde die parametrische Statistik den Stichprobenmittelwert und die Stichprobenstandardabweichung verwenden, um die Werte von µ bzw. σ2 zu schätzen. Die Modellstruktur der nichtparametrischen Statistik wird aus den beobachteten Daten im Gegensatz zu einem bestimmten Priori abgeleitet . Der Begriff nichtparametrisch selbst impliziert, dass die Anzahl und Art der Parameter flexibel sind und nicht, dass ihnen Parameter vollständig fehlen.

Arten nichtparametrischer Statistiken

Es gibt zwei Haupttypen nichtparametrischer statistischer Methoden. Die erste Methode versucht, die unbekannte zugrunde liegende Verteilung der beobachteten Daten zu ermitteln, während die zweite Methode versucht, eine statistische Schlussfolgerung zu ziehen, ohne die zugrunde liegende Verteilung zu berücksichtigen.

Kernel-Methoden und Histogramme Histogramm Ein Histogramm wird verwendet, um diskrete oder kontinuierliche Daten zusammenzufassen. Mit anderen Worten, ein Histogramm bietet eine visuelle Interpretation numerischer Daten, indem die Anzahl der Datenpunkte angezeigt wird, die in einen bestimmten Wertebereich fallen (sogenannte „Bins“). Ein Histogramm ähnelt einem vertikalen Balkendiagramm. Ein Histogramm wird jedoch üblicherweise verwendet, um die Werte der Parameter im ersten Ansatz zu schätzen. Im Gegensatz dazu beinhaltet die letztere Methode das Testen von Hypothesen ohne die tatsächlichen Datenwerte, sondern basierend auf der Rangfolge der Daten.

Die nichtparametrischen Statistiktests sind in der Regel einfacher anzuwenden als die parametrischen Statistiken, da keine Annahmen über die Populationsparameter getroffen wurden. Standardmathematische Verfahren zum Testen von Hypothesen machen keine Annahmen über die Wahrscheinlichkeitsverteilungen - einschließlich Verteilungs-T-Tests, Vorzeichentests und Einzelpopulations-Inferenzen.

Wenn Sie beispielsweise die Hypothese testen, dass „es einen Unterschied im Median gibt“, definieren die beiden Zufallsvariablen X und Y zwei kontinuierliche Verteilungen zwischen dem Ort, an dem die Hypothese durchgeführt wird, und der gepaarten Stichprobe. Neben der allgemeinen Anwendbarkeit fehlt dem Test auch die statistische Aussagekraft anderer Tests, da er unter einigen Voraussetzungen funktioniert.

Beispiele für nichtparametrische Statistiken

Nehmen wir an, ein Forscher ist daran interessiert, die Anzahl der im Bundesstaat Kalifornien mit Gelbsucht geborenen Babys abzuschätzen. Eine Analyse des Datensatzes kann durchgeführt werden, indem eine Probe von 5.000 Babys entnommen wird. Eine Schätzung der Gesamtpopulation von Babys mit Gelbsucht, die im folgenden Jahr geboren wurden, ist die abgeleitete Messung.

Betrachten Sie für einen zweiten Fall zwei Gruppen unterschiedlicher Forscher. Sie sind daran interessiert zu wissen, ob Blanket-Marketing oder kommerzielles Marketing damit zusammenhängt, wie schnell ein Unternehmen seine Markenpositionierung erreicht. Unter der Annahme, dass die Stichprobengröße zufällig ausgewählt wird, bezieht sich ihre Verteilung hinsichtlich der Geschwindigkeit, mit der ein Unternehmen eine Markenpositionierung realisiert. Marktpositionierung Die Marktpositionierung bezieht sich auf die Fähigkeit, die Wahrnehmung der Verbraucher in Bezug auf eine Marke oder ein Produkt im Vergleich zu Wettbewerbern zu beeinflussen. Das Ziel des Marktes kann als normal angenommen werden. Es kann jedoch nicht davon ausgegangen werden, dass ein Experiment, das die strategischen Ziele des Unternehmens misst, um die Marktdynamik anzugehen (die auch die Markenpositionierung bestimmt), eine normale Verteilung annimmt.

Die Hauptidee hinter dem Phänomen ist, dass zufällig ausgewählte Daten Faktoren wie die Marktdynamik enthalten können. Im anderen Extremfall werden die strategischen Ziele des Unternehmens die Stichprobengröße wahrscheinlich nicht beeinflussen, wenn Faktoren wie Marktsegment und Wettbewerb eine Rolle spielen. Ein solcher Ansatz ist effektiv, wenn den Daten eine klare numerische Interpretation fehlt.

Zum Beispiel können Tests, ob Kunden ein bestimmtes Produkt aufgrund seines Nährwerts bevorzugen, eine Rangfolge seiner Metriken enthalten, die stark übereinstimmen, zustimmen, gleichgültig, nicht zustimmen und stark nicht zustimmen. In einem solchen Szenario ist eine nichtparametrische Methode nützlich.

Die zentralen Thesen

Die Verwendung nichtparametrischer statistischer Ansätze in der Forschung erfordert eine sorgfältige Prüfung der Schwächen, Stärken und potenziellen Fallstricke. Es ist wahr, dass für die Datenverteilung mit übermäßiger Kurtosis oder Schiefe; rangbasierte nichtparametrische Tests erweisen sich als wirksamer als die parametrischen Tests.

Trotzdem werden nicht alle Fälle, in denen parametrische Annahmen nicht erfüllt sind, nichtparametrische Statistiken als Ersatzmethoden verwendet, da das aus den früheren Statistiken erhaltene Vertrauen vergleichsweise gering ist.

Nichtparametrische Statistiken werden geschätzt, da sie problemlos angewendet werden können. Die Daten werden für verschiedene Tests besser anwendbar, da die Parameter nicht obligatorisch sind. Noch wichtiger ist, dass die Statistiken verwendet werden können, wenn wichtige Informationen wie Mittelwert, Standardabweichung oder Stichprobengröße fehlen. Die Funktionen machen nichtparametrische Statistiken zu einem breiteren Anwendungsbereich als parametrische Statistiken.

Zusätzliche Ressourcen

Finance ist der offizielle Anbieter der globalen CBCA-Zertifizierung (Certified Banking & Credit Analyst). Die CBCA-Akkreditierung (Certified Banking & Credit Analyst) ist ein globaler Standard für Kreditanalysten, der Finanzen, Rechnungswesen, Kreditanalyse und Cashflow-Analyse umfasst , Covenant-Modellierung, Kreditrückzahlungen und mehr. Zertifizierungsprogramm, das jedem helfen soll, ein erstklassiger Finanzanalyst zu werden. Um Ihre Karriere weiter voranzutreiben, sind die folgenden zusätzlichen Finanzressourcen hilfreich:

  • Grundlegende Statistikkonzepte im Finanzwesen Grundlegende Statistikkonzepte für das Finanzwesen Ein solides Verständnis der Statistik ist von entscheidender Bedeutung, um das Finanzwesen besser zu verstehen. Darüber hinaus können statistische Konzepte den Anlegern bei der Überwachung helfen
  • Hypothesentest Hypothesentest Hypothesentest ist eine Methode zur statistischen Inferenz. Es wird verwendet, um zu testen, ob eine Aussage zu einem Populationsparameter korrekt ist. Hypothesentest
  • Nenndaten Nenndaten In der Statistik sind Nenndaten (auch als Nennskala bezeichnet) eine Art von Daten, mit denen Variablen ohne Angabe eines quantitativen Werts gekennzeichnet werden
  • Nichtparametrische Tests Nichtparametrische Tests In der Statistik sind nichtparametrische Tests Methoden der statistischen Analyse, für die keine Verteilung erforderlich ist, um die erforderlichen zu analysierenden Annahmen zu erfüllen

Empfohlen

Wie hoch ist das Times Interest Earned Ratio?
Was sind die Eigenkapitalkosten?
Was ist Sozialismus?