Statistik lernen, von der Präsentation bis zur Datenverteilung

Statistik ist eine mathematische Wissenschaft, die die Datenerfassung, -verarbeitung, -analyse und -präsentation untersucht. Statistiken werden häufig in Versicherungsunternehmen verwendet. Eine davon besteht darin, die Höhe der Prämie in einer Versicherungspolice zu bestimmen. Jeder Versicherungsnehmer muss einen Beitrag leisten, der als Prämie bezeichnet wird. Die gezahlte Prämie richtet sich nach dem Versicherungsschutz, den er erhält.

Hier verwendet die Versicherungsgesellschaft Statistiken, damit die Höhe der Prämie der Höhe des Versicherungsschutzes entspricht, der dem Versicherungsnehmer zur Verfügung gestellt werden kann. Auf diese Weise profitieren beide Parteien davon.

Wie bereits erwähnt, erfassen und verarbeiten Statistiken nicht nur Daten, sondern präsentieren sie auch. Die Statistik verwendet auch mehrere Datenverteilungsmaßnahmen bei der Datenverarbeitung. Heute werden wir die Arten der Präsentation sowie die Größe der Verbreitung von Daten in Statistiken diskutieren.

Arten der Datenpräsentation

Zu den Arten der Datenpräsentation in Statistiken gehören Häufigkeitsverteilungstabellen, Histogramme, Polygone und Ogiven.

Die erste Form der Datenpräsentation ist die Verwendung einer Häufigkeitsverteilungstabelle. Wie der Name schon sagt, verwenden wir eine Tabelle, um den Typ und die Menge der erhaltenen Daten anzuzeigen. Die Häufigkeitsverteilungstabelle hat auch mehrere Typen, nämlich die Häufigkeitsverteilungstabelle für Einzel- und Gruppendaten.

(Lesen Sie auch: Zwei Messdaten in der Statistik)

Eine einzelne Datenhäufigkeitsverteilungstabelle wird verwendet, um kleine Datenmengen darzustellen, mindestens weniger als 30 Daten. Ein Beispiel für die Darstellung von Daten unter Verwendung einer einzelnen Datenhäufigkeitsverteilungstabelle ist wie folgt.

Die folgenden Daten sind die Testergebnisse von 30 Studenten. In einer einzigen Datenhäufigkeitsverteilungstabelle servieren!

4 8 7 9 10 3 4 6 7 6 5 7 7 8 9 6 6 8 7 9 4 5 6 7 8 10 4 5 6 7

Wenn wir darauf achten, ist die niedrigste erhaltene Testnote 3, während die höchste 10 ist. Aus diesen Punktzahlen wird dann die Anzahl der Schüler berechnet, die sie erhalten. Für eine Klasse von 3 zum Beispiel nur 1 Schüler. Für die 4. Klasse gibt es 4 Schüler und so weiter. Diese Abbildung wird dann in einer Tabelle wie der folgenden dargestellt.

Turbinen auf dem Boden eines Offshore-Windparks

Die nächste Art der Häufigkeitsverteilungstabelle ist die Häufigkeitsverteilungstabelle für Gruppendaten. Diese Tabelle wird verwendet, um viele Daten darzustellen, dh mehr als 30 Daten. Schauen wir uns das folgende Beispiel an.

Das Folgende ist die Höhe von Chili-Pflanzen (in Millimetern) in einer Chili-Plantage. Präsentieren Sie die Daten in einer Gruppendatenverteilungstabelle!

123 131 120 128 126 124 125 122

121 126 124 123 122 120 125 126

123 123 134 125 125 126 128 135

120 126 124 133 126 127 123 126

122 125 123 132 124 132 128 124

Im Gegensatz zu einzelnen Daten müssen wir hier die Anzahl der Klassen und Klassenlängen berechnen, die in der Tabelle angezeigt werden. Unter Verwendung der obigen Daten sind hier die Berechnungen.

Viele Daten (n) = 40

Maximale Höhe (xmax) = 135

Mindesthöhe (xMindest) = 120

Bereich (J) = xmax - xMindest = 135 – 120 = 15

Anzahl der Klassen (k) = 1 + 3,3 logn = 1 + 3,3 log40 = 6,2868… ≈ k = 6

Die Klassenlänge (c) = J / k = 15/6 = 2,5 ≤ c = 3

Aus diesen Ergebnissen können wir die Gruppendatenverteilungstabelle wie folgt anzeigen.

Turbinen auf dem Boden eines Offshore-Windparks

Als nächstes werden wir andere Arten der gruppierten Datenpräsentation diskutieren, nämlich in Form von Histogrammen, Frequenzpolygonen und Ogiven. Schauen Sie sich die Häufigkeitstabelle unten an, die Gewichtsinformationen für 80 Sportvereinmitglieder enthält.

Turbinen auf dem Boden eines Offshore-Windparks

Um die Daten mithilfe eines Histogramms darzustellen, erstellen wir zunächst ein kartesisches Diagramm. Die x-Achse zeigt die oberen und unteren Grenzen jeder Klasse, während die y-Achse die Frequenz zeigt.

Statistik4 (1)

Im Gegensatz zu einem Histogramm nimmt ein Frequenzpolygondiagramm den Mittelwert des Klassenintervalls und zeigt ihn mit Linien entsprechend der Häufigkeit an.

Statistik5 (1)

Schließlich verwendet die Darstellung der Daten eine positive kumulative oder negative Frequenzkurve. Markieren Sie zunächst die kumulativen Frequenzwerte jeder Intervallklasse auf der y-Achse. Markieren Sie dann die Koordinaten der Punkte gemäß den oberen Grenzpaaren der Intervallklasse und der kumulativen Häufigkeit. Verbinden Sie die Punkte zu einer glatten Kurve.

Datenverbreitungsgröße

In der Statistik gibt es zwei Arten der Datenmessung, nämlich die Größe der Datenkonzentration und die Größe der Datenverteilung. Was ist die Erklärung und der Unterschied?

Die Größe des Rechenzentrums ist ein Wert, der den Speicherort der Daten darstellt. In der datenzentrierten Messung gibt es Mittelwert, Modus und Median.

Der Durchschnitt oder Mittelwert ist der Quotient zwischen der Summe aller beobachteten Daten mit einer großen Anzahl von Daten. Der Mittelwert kann wie folgt formuliert werden.

Mittelwert = (Summe aller Daten) / (Viele Daten)

Um dies besser zu verstehen, arbeiten wir am folgenden Beispielproblem. Die Anzahl der Stunden pro Woche, die 5 Personen für soziale Aktivitäten in ihrer Umgebung benötigen, beträgt 10, 7, 13, 20 und 15 Stunden. Bestimmen Sie die durchschnittliche Anzahl der Stunden pro Woche, die sie für soziale Aktivitäten aufwenden!

Basierend auf den obigen Problemen können wir die Zahlen wie folgt in die Formel eingeben.

Mittelwert = (10 + 7 + 13 + 20 + 15) / 5 = 65/5 = 13

Dies bedeutet, dass die durchschnittliche Anzahl der Stunden, die sie für soziale Aktivitäten aufwenden, 13 Stunden beträgt.

Neben dem Mittelwert oder Mittelwert gibt es auch Modi. Der Modus ist der Wert, der in Daten am häufigsten vorkommt. Schauen wir uns ein Beispiel für das folgende Problem an.

Nachfolgend finden Sie die Gewichtsdaten (in Kilogramm) einiger Schüler der 7. Klasse. Bestimmen Sie den Modus der Daten!

32, 35, 33, 32, 34, 31, 35, 35, 31, 34, 35, 3

Zunächst müssen wir zählen, wie oft jeder Wert in den Daten erscheint. Basierend auf diesen Daten erhalten wir 31 (x3), 32 (x2), 33 (x1), 34 (x2) und 35 (x4). Da 35 am häufigsten auftritt, ist der Modus der obigen Daten 35.

Die letzte Art der datenzentrierten Messung ist der Median. Der Median teilt die Daten in zwei gleiche Teile, so dass der Median der Mittelwert der sortierten Daten ist.

Um den Median zu bestimmen, müssen wir zuerst alle Daten in absteigender oder aufsteigender Reihenfolge sortieren. Zweitens definieren Sie viele Daten und symbolisieren Sie sie als "n". Wenn n ungerade ist, verwenden wir folgende Formel.

Median = Datennummer - ((n + 1) / 2)

Wenn n gerade ist, verwenden wir die folgende Formel.

Median = (Daten mit (n / 2) + Daten mit (n / 2 + 1)) / 2

Die zweite Messung von Daten in der Statistik ist ein Maß für die Verbreitung von Daten. Die Größe der Datenverteilung ist ein Wert, der angibt, wie weit die Daten vom Rechenzentrum entfernt sind. Die Größe der Datenverteilung besteht aus dem Bereich, dem Quartil und dem Interquartilbereich.

Der Bereich ist die Differenz zwischen dem größten Datenwert und dem kleinsten Datenwert. Wir können die Reichweite erreichen, indem wir die größten Daten von den kleinsten Daten subtrahieren. Wenn zum Beispiel in einer Klasse der größte Schüler eine Körpergröße von 160 cm und der kürzeste Schüler eine Körpergröße von 143 cm hat, erhalten wir eine Reichweite von 23 cm.

Quartil ist die Gruppierung statistischer Daten in vier gleiche Teile. Die Quartilgröße ist in 3 unterteilt, nämlich das untere Quartil (Q.1), das mittlere Quartil (Q.2 oder Median) und das obere Quartil (Q.3). Um jedes Quartil zu bestimmen, müssen wir mehrere Schritte unternehmen.

Sortieren Sie die Daten zunächst in aufsteigender oder absteigender Reihenfolge. Zweitens bestimmen Sie den mittleren oder mittleren Wert der Daten. Drittens finden Sie das untere Quartil (Q.1), der der Mittelwert der Datengruppe unter dem Median ist (Q.2). Finden Sie schließlich das obere Quartil (Q.3), nämlich der Mittelwert der Datengruppe über dem Median (Q.2).

Die letzte Art der Datenverteilungsmessung ist der Interquartilbereich. Der Interquartilbereich ist der Unterschied zwischen dem oberen und dem unteren Quartil. Die Formel lautet wie folgt.

Q.d = Q.3 - Q.1

kürzliche Posts

$config[zx-auto] not found$config[zx-overlay] not found