Wahrscheinlichkeit | Ereignis | Benford-Verteilung | Satz von Bayes

Verteilung nach Benfords Gesetz

Ermitteln der ersten Ziffern der Werte eines Datensatzes und Vergleich mit der nach dem Gesetz von Benford zu erwartenden Verteilung bei empirischen Werten. Das Gesetz von Benford oder von Newcomb-Benford besagt, dass bei empirisch gemessenen Werten die Anfangsziffern in einer bestimmten Häufigkeit vorkommen. Häufigste Anfangsziffer ist die 1 mit 30,1 %, zweithäufigste die 2 mit 17,61 %, und so weiter. Die zu erwartenden Häufigkeiten bei einem großen Datensatz sind unten angegeben.
Hat man nun einen Datensatz mit Zahlwerten, kann man ihn hier eingeben und die Verteilung von dessen Anfangsziffern im Vergleich zur erwarteten Verteilung betrachten. Liegen genügend Daten vor, etwa über 100 Werte, und weicht die Verteilung sichtbar stark von der nach Benford erwarteten ab, dann ergibt sich der Verdacht, dass die Daten nicht empirisch ermittelt wurden. Bei beispielsweise zufällig erzeugten Werten wären die Anfangsziffern gleichverteilt.

Bitte hier einen Datensatz eingeben. Die einzelnen Werte müssen durch Leerzeichen, Zeilenumbruch oder ; voneinander getrennt sein:

Anzahl der Werte:

Ziffer	Wahrscheinlichkeit	Anteil
1	30.1 %	%
2	17.61 %	%
3	12.49 %	%
4	9.69 %	%
5	7.92 %	%
6	6.69 %	%
7	5.8 %	%
8	5.12 %	%
9	4.58 %	%

Die grau unterlegten Werte sind die gemessenen, die weiß unterlegten die nach Benfords Gesetz erwarteten.

Die Wahrscheinlichkeiten für die Ziffern n∈[1;9] berechnen sich mit ( log₁₀(n+1) - log₁₀(n) ) * 100%.

Hier muss die Entscheidung nach dem Vertrauen in die Messwerte nach Augenschein erfolgen. Für eine verlässliche Aussage, ob die getesteten Werte empirisch ermittelt wurden, können je nach Art der Werte statistische Tests wie der Χ²-Test oder der Kolmogorow-Smirnow-Test gemacht werden, um eine Signifikanz zu ermitteln. Dazu sei auf spezielle statistische Software verwiesen.

Beispieldatensatz füllt das Eingabefeld mit den Bevölkerungszahlen aller Länder der Erde aus dem Jahr 2016. Diese Daten sind also empirisch. Man erkennt Abweichungen vom Erwartungswert und unerwartete Messwerte, z.B. dass die 6 häufiger vorkommt als die 5. Diese Unterschiede sind aber nicht sehr groß, so dass dieser Test keinen Grund liefert, die empirische Herkunft der Zahlen anzuzweifeln.

Alle Angaben ohne Gewähr | © Jumk.de Webprojekte | Rechneronline.de | Impressum & Datenschutz | Siehe auch Kombinatorik-Funktionen