Najbardziej tajemniczy rozkład statystyczny – dowód na to, że żyjemy w symulacji?

Intro

Co ma wspólnego mają ze sobą liczba lajków pod postami gwiazd Tik-Toka, roczne zarobki Polaków oraz powierzchnia wszystkich państw na świecie? Otóż łączy je pewna zadziwiająca reguła…

Jak myślicie, jak często cyfra 1 pojawia się na początku wszystkich tych wartości? Logicznie myślący człowiek wziąłby sobie wszystkie możliwe cyfry, które mogą wystąpić na początku tych wartości (czyli od 1 do 9 – w sumie 9) i podzielił 100% przez liczbę możliwych opcji (czyli 9), co dałoby około 11%. Brzmi logicznie? Ale czy tak jest w rzeczywistości? A co, gdybym powiedział Ci teraz, że cyfra 1 występuje na początku wszystkich liczb w ponad 30% przypadków? To nie żart, ale fascynujące zjawisko, które już w XIX wieku zaobserwował pewien kanadyjski astronom Simon Newcomb, a które dzisiaj (od nazwiska amerykańskiego inżyniera) znamy jako Rozkład Benforda.

O Rozkładzie Benforda

Spójrzmy na liczby. Załadowałem sobie dane dotyczące populacji, powierzchni oraz PKB dla wszystkich krajów świata. Następnie powycinałem z nich pierwsze cyfry i stworzyłem histogramy. Czy pierwsze cyfry rozkładają się równomiernie? Spójrzcie sami, oto pierwszy wykres powstały z danych odnośnie populacji.

Jeżeli chodzi o cyfra 1 znalazła się na pierwszej pozycji w prawie 60 krajach, cyfra 2 w ponad 40 krajach, a cyfra 9 w niecałych 10 krajach, przypadek?

Znów 'jedynka’ przoduje, sporo jest także 'dwójki’, a najmniej dziewiątki (’enka’ oznacza brak danych). Sprawdźmy teraz powierzchnię w milach.

Rozkład znów wygląda podobnie. Niesamowite, prawda? A zgadnijcie, co by się stało gdybyśmy powierzchnię z mil przekonwertowali na kilometry? Zachęcam Jeżeli nie wierzycie, że Prawo Benforda działa to weźcie jakąkolwiek książkę i wypiszcie występujące w niej liczby (oprócz numerów stron). Możecie zrobić podobnie z lajkami pod postami swojego ulubionego celebryty.

Generalnie Rozkład Benforda (prawdopodobieństwo wystąpienia cyfry na pierwszej pozycji w jakiejś liczbie) wygląda tak:

Co ciekawe, prawdopodobieństwo wystąpienia danej cyfry na drugim miejscu jest już praktycznie jednakowe dla każdej z cyfr i wraz z każdą kolejną pozycją cyfry w liczbie (trzeciej pozycji, czwartej pozycji, etc…) rozkład zbliża się do rozkładu jednostajnego (czyli im dalsza pozycja w liczbie tym każda cyfra ma takie samo prawdopodobieństwo wystąpienia).

Został opracowany wzór, dzięki któremu możemy obliczyć prawdopodobieństwo wystąpienia danej cyfry d na pierwszej pozycji i wygląda on następująco.

P(d)={ln(1+{1 \above{2pt} 1+d})\above{2pt} ln(10)}

Dla przykładu prawdopodobieństwo wystąpienia cyfry 1 na pierwszej pozycji obliczymy podstawiając za d liczbę 1.

P(1)={ln(1+{1 \above{2pt} 1+1})\above{2pt} ln(10)}=0.301

Wykorzystanie Prawa Benforda

Rozkład Benforda zwykle znajduje zastosowanie w dużych zbiorach naturalnie występujących liczb (tam gdzie występuje kilka rzędów wielkości) takich jak na przykład:

  • ceny akcji
  • liczby znalezione w gazetach, książkach, atrykułach
  • dane demograficzne
  • dane dotyczące dochodów
  • stałe matematyczne
  • polubienia na portalach społecznościowych

Rozkład Benforda nie znajduje zazwyczaj zastosowania w danych 'sztucznych’ https://schule-weiler.de/letter-r/index.html , czyli takich które ustala lub przypisuje człowiek (np. numery telefonów, kody pocztowe) oraz takich, które mają ograniczony rozkład wartości (np. wzrost dorosłego człowieka – najczęściej jest to 150-200 cm, więc siłą rzeczy rzeczone prawo nie znajdzie tutaj zastosowanie – nie ma ludzi, którzy maja np. 500 cm wzrostu).

Prawo Benforda wykorzystać można do wykrywania defraudacji oraz oszustw podatkowych. Podczas gdy rzeczywiste zeznania podatkowe są zgodne z rozkładem Benforda, sfabrykowane już nie. Prawo Benforda użyto w 2001 roku do analizowania sprawy Grecji ubiegającej się o dołączenie do Unii i na tej podstawie wykazano, że niektóre dane ekonomiczne mogły zostać zmanipulowane.

Prawo Benforda możemy wykorzystać także do sprawdzenia poprawności naszego modelowania danych. Załóżmy, że przewidujemy populację dla dystryktów w Chinach za następne 5 lat. Jeżeli widzimy, że pierwsze cyfry aktualnych populacji wpadają w rozkład Benforda, wtedy możemy sprawdzić rozkład pierwszych cyfr po naszym modelowaniu. Czy rozkład zmienił się? Jeżeli tak, to może oznaczać, że w naszym modelu jest gdzieś błąd i wymaga on dodatkowej inspekcji.

Czy to dowód na to, że żyjemy w symulacji?

Rozkład Benforda jest, jako prawo, trudny do udowodnienia matematycznie, bardziej jest to po prostu teoria, która działa. Zostało podjętych wiele prób udowodnienia tego fenomenu, jednak na chwilę obecną nie ma pełnej odpowiedzi wyjaśniającej to zjawisko. Czy to oznacza jednak, że żyjemy w symulacji i ktoś z góry zaprogramował nasz świat? Niekoniecznie… zagłębiając się w istotę wszechświata możemy zaobserwować wiele fascynujących zależności i wzorców, które wprawiają nas w zdumienie i skłaniają do refleksji oraz poszukiwania wyjaśnień. Prawo Benforda jest niewątpliwie jednym z tych intrygujących zjawisk. Aby poczytać o innych koniecznie śledźcie naszego bloga, ponieważ będziemy opisywać tutaj więcej ciekawych zagadnień.

Referencje

  • Benford, F. “The Law of Anomalous Numbers,” Proceedings of the American Philosophical Society, 78, 551–572. 1938.
  • Stephanie Glen. „Benford’s Law (The First Digit Law): Simple Definition, Examples”

Dodaj komentarz