Statistik ist ein Begriff, der vom lateinischen Wort „Status“ abgeleitet ist. Dies bedeutet eine Gruppe von Zahlen, die zur Darstellung von Informationen über ein menschliches Interesse verwendet werden. Es bezieht sich auf die Technik, die zum Sammeln, Überprüfen, Analysieren und Ziehen von Schlussfolgerungen aus quantifizierten Daten entwickelt wurde. Die erhaltenen Daten werden dann im Entscheidungsprozess verwendet.
Finanzanalysten Finanzanalysten - Was tun sie? Verwenden Sie statistische Methoden, um große Datenmengen zu analysieren, zu bewerten und in einer nützlichen mathematischen Form zusammenzufassen. Statistik wird in zahlreichen Disziplinen wie Wirtschaft, Sozialwissenschaften, Fertigung, Psychologie usw. angewendet.
Arten von Statistiken
Das Studium der Statistik ist in zwei Hauptkategorien unterteilt. Sie enthalten beschreibende und inferentielle Statistiken.
1. Beschreibende Statistik
Beschreibende Statistiken beschreiben die Grundmerkmale einer Population und wie die Daten organisiert sind. Auf diese Weise können Analysten die Eigenschaften von Daten erkennen und diese Daten verstehen. Angenommen, ein Computergeschäft verkauft elektronische Geräte, und von den 1.000 verkauften elektronischen Geräten sind 300 Laptops. Mit diesen Daten würde eine Beschreibung der Daten 30% der Stichprobe Laptops darstellen.
Es gibt zwei Haupttypen deskriptiver Statistiken, die Wissenschaftler verwenden. Dazu gehören:
Maße der zentralen Tendenz
Zentrale Tendenz Zentrale Tendenz Die zentrale Tendenz ist eine beschreibende Zusammenfassung eines Datensatzes durch einen einzelnen Wert, der das Zentrum der Datenverteilung widerspiegelt. Zusammen mit den Variabilitätsmaßen umfassen den Mittelwert, den Median und den Modus. Sie werden verwendet, um die allgemeinen Trends mit den Daten anzuzeigen. Der Mittelwert wird verwendet, um den Durchschnitt aller Komponenten eines Datensatzes anzuzeigen, während der Median die Mitte der Daten darstellt, z. B. das mittlere Alter der Studenten, die das College besuchen. Der Modus wird verwendet, um die häufigsten Daten in einer Population anzuzeigen, z. B. das häufigste Alter der Schüler im ersten Studienjahr.
Ausbreitungsmaße
Spread-Messungen zeigen, wie ähnlich oder unterschiedlich eine Reihe von Werten ist und wie sie sich zueinander verhalten. Einige der Statistiken, die zur Beschreibung der Datenverteilung verwendet werden, umfassen Bereich, Quartile, Varianzen, absolute Abweichung, Häufigkeitsverteilung und Standardabweichung. Standardabweichung Aus statistischer Sicht ist die Standardabweichung eines Datensatzes ein Maß für die Größe der Abweichungen zwischen den Werten der enthaltenen Beobachtungen.
In einer Klasse mit 20 Schülern kann die durchschnittliche Punktzahl für eine Mathematikarbeit beispielsweise 70 von 100 Punkten betragen. Obwohl der Durchschnitt 70 Punkte beträgt, bedeutet dies nicht, dass alle Schüler 70 Punkte erzielen. Vielmehr bedeutet dies, dass die Punkte sowohl unter als auch über dem Durchschnitt verteilt werden. In diesem Fall werden die Spread-Maße verwendet, um zu zeigen, wie die Scores verteilt sind.
2. Inferenzstatistik
Inferenzstatistiken verwenden komplexe mathematische Berechnungen, um Trends über eine große Population abzuleiten. Bei der Analyse einer großen Population ist es schwierig, jedes Mitglied dieser Population einzeln zu analysieren. Vielmehr verwenden Wissenschaftler Inferenzstatistiken, um die Beziehungen zwischen Variablen in einer Stichprobenpopulation zu bestimmen, und verwenden dann die Informationen, um Vorhersagen darüber zu treffen, wie sich die Variablen auf die allgemeine Population beziehen.
Wenn Wissenschaftler beispielsweise die Anzahl der verheirateten Männer in einer Bevölkerung von einer Million Männern analysieren, werden sie eine Stichprobe aus der Bevölkerung von einer Million Männern entnehmen und dann auf der Grundlage der aus der Stichprobe erhaltenen Informationen Verallgemeinerungen über die gesamte Bevölkerung vornehmen.
Die zwei Hauptklassifikationen der Inferenzstatistik umfassen Folgendes:
Konfidenzintervall
Das Konfidenzintervall Konfidenzintervall Ein Konfidenzintervall ist eine Schätzung eines Intervalls in Statistiken, das einen Populationsparameter enthalten kann. Der unbekannte Populationsparameter wird durch einen Stichprobenparameter ermittelt, der aus den Stichprobendaten berechnet wird. Beispielsweise wird der Populationsmittelwert μ unter Verwendung des Stichprobenmittelwerts x̅ ermittelt. wird aus der Statistik der beobachteten Daten berechnet, die den tatsächlichen Wert eines unbekannten Populationsparameters enthalten können.
Hypothesentest
Hypothesentest Hypothesentest Der Hypothesentest ist eine Methode zur statistischen Inferenz. Es wird verwendet, um zu testen, ob eine Aussage zu einem Populationsparameter korrekt ist. Hypothesentests werden durchgeführt, wenn Wissenschaftler eine Stichprobe einer Population analysieren und diese Informationen dann verwenden, um einen Anspruch auf die große Population zu erheben, zu der die Stichprobe gehört.
Eigenschaften der Statistik
Einige der potenziellen Merkmale, die eine Statistik enthalten sollte, sind:
1. Vollständigkeit
Vollständigkeit bezieht sich auf einen Hinweis darauf, ob die zur Deckung des Informationsbedarfs erforderlichen Daten in der Datenressource verfügbar sind oder nicht. Die Vollständigkeit der Daten ist erforderlich, um die Richtigkeit der beobachteten Daten sicherzustellen.
2. Konsistenz
Konsistenz wird im Hinblick auf die Einheitlichkeit oder Stabilität der Daten gesehen. Einige der Statistiken zur Messung der Konsistenz umfassen Standardabweichung, Bereich und Varianz. Bei der Messung der Konsistenz von Daten aus einer Stichprobe, die für eine große Population repräsentativ ist, wird normalerweise der Standardfehler des Mittelwerts untersucht.
Wenn Instrumente zum Sammeln von Daten verwendet werden, kann die Konsistenz auch durch Schätzen der Zuverlässigkeit der erhaltenen Bewertungen gemessen werden.
3. Suffizienz
Eine Statistik wird als ausreichend angesehen, wenn keine andere Statistik aus der Stichprobe berechnet werden kann. Das Suffizienzkonzept ist in der deskriptiven Statistik aufgrund seiner starken Abhängigkeit von der Annahme der Datenverteilungsform üblich.
4. Unvoreingenommenheit
Die Verzerrung der Statistik wird durch die Differenz zwischen dem wahren Wert des gemessenen Parameters und dem erwarteten Wert des Schätzers bestimmt. Wenn der Mittelwert der Stichprobenverteilung und der erwartete Wert des Parameters gleich sind, wird die Statistik als unvoreingenommen betrachtet.
Verwandte Lesungen
Finance ist der offizielle Anbieter der globalen FMVA®-Zertifizierung (Financial Modeling & Valuation Analyst). Schließen Sie sich mehr als 350.600 Studenten an, die für Unternehmen wie Amazon, JP Morgan und Ferrari arbeiten, um jedem zu helfen, ein erstklassiger Finanzanalyst zu werden . Um weiter zu lernen und Ihre Karriere voranzutreiben, sind die folgenden zusätzlichen Finanzressourcen hilfreich:
- Bayes-Theorem Bayes-Theorem In der Statistik und Wahrscheinlichkeitstheorie ist das Bayes-Theorem (auch als Bayes-Regel bekannt) eine mathematische Formel zur Bestimmung der Bedingung
- Korrelationsmatrix Korrelationsmatrix Eine Korrelationsmatrix ist einfach eine Tabelle, in der die Korrelationskoeffizienten für verschiedene Variablen angezeigt werden. Die Matrix zeigt die Korrelation zwischen allen möglichen Wertepaaren in einer Tabelle. Es ist ein leistungsstarkes Tool, um einen großen Datensatz zusammenzufassen und Muster in den angegebenen Daten zu identifizieren und zu visualisieren.
- Gesetz der großen Zahlen Gesetz der großen Zahlen In der Statistik und der Wahrscheinlichkeitstheorie ist das Gesetz der großen Zahlen ein Satz, der das Ergebnis der Wiederholung desselben Experiments über eine große Anzahl von Zahlen beschreibt
- Gesamtwahrscheinlichkeitsregel Gesamtwahrscheinlichkeitsregel Die Gesamtwahrscheinlichkeitsregel (auch als Gesetz der Gesamtwahrscheinlichkeit bekannt) ist eine grundlegende Regel in der Statistik in Bezug auf bedingte und marginale