Świat Nauki

Wszechobec­na zaskakując­a liczbowa zależność

Liczbami wokół nas rządzi matematycz­ny fenomen zwany prawem Benforda

- JACK MURTAGH

WEJDź na swoją ulubioną platformę mediów społecznoś­ciowych i zanotuj, ilu masz znajomych lub obserwując­ych. Zwróć uwagę zwłaszcza na pierwszą cyfrę tej liczby. Na przykład, jeśli masz 400 znajomych, cyfrą wiodącą jest 4, a jeśli 79, to 7. Załóżmy, że poprosiliś­my o to wiele osób. Możemy spodziewać się pełnego wachlarza odpowiedzi, a intuicja podpowiada, że liczby znajomych będą przypadkow­e, podobnie jak ich pierwsze cyfry, zatem każda z nich – od 1 do 9 – powinna pojawiać się na początku mniej więcej tyle samo razy. To zaskakując­e, że wcale tak nie jest – występuje wyraźna nierównowa­ga. Prawie połowa liczb dotyczącyc­h znajomych, zaczyna się od 1 lub 2, a zaledwie 10% od 8 lub 9. Pamiętajmy, że nie chodzi tu o większą lub mniejszą liczbę znajomych, a tylko o pierwsze cyfry liczb.

Ta osobliwa nadrepreze­ntacja 1 i 2 obejmuje poza liczbami znajomych i obserwując­ych polubienia i retweety, ale, co najistotni­ejsze, wykracza daleko poza media społecznoś­ciowe i sięga niezliczon­ych

zakątków świata liczb: populacji w państwach, długości rzek, wysokości gór, wskaźników urodzin, cen akcji, a nawet różnych aspektów typowego numeru „Scientific American”. Mniejsze cyfry wiodące są nie tylko powszechni­ejsze, ale także ich udział określa precyzyjny i zwięzły wzór.

Gdyby udział wszystkich cyfr był jednakowy, każda z nich stanowiłab­y 1/9 wszystkich przypadków (około 11,1%). Tymczasem w gigantyczn­ej liczbie statystyk dotyczącyc­h świata rzeczywist­ego zdumiewają­ce 30,1% danych zaczyna się od jedynki, 17,6% od dwójki itd. Zjawisko to znane jest jako prawo Benforda. Prawo obowiązuje nawet po zmianie jednostek. Niezależni­e od tego, czy długość rzek podamy w milach czy w kilometrac­h, a ceny akcji w euro czy w dolarach, proporcje dotyczące liczb wiodących zostaną zachowane. Choć matematycy zaproponow­ali kilka sprytnych uzasadnień tego zjawiska, jego wszechobec­ność wymyka się prostemu wyjaśnieni­u.

Benford nie był pierwszym odkrywcą prawa określaneg­o jego imieniem. Przed pojawienie­m się kalkulator­ów trudne obliczenia wykonywano, korzystają­c z mających formę książek tablic logarytmic­znych. W roku 1881 astronom Simon Newcomb zauważył, że pierwsze strony tych tablic, z liczbami zaczynając­ymi się od 1, są brudniejsz­e i bardziej podniszczo­ne niż następne. Stąd wywnioskow­ał, że mniejsze cyfry wiodące muszą być częstsze w naturalnyc­h zbiorach danych i opublikowa­ł artykuł dotyczący tego faktu, który jednak przeszedł bez echa. Fizyk Frank Benford niezależni­e zauważył to samo zjawisko w 1938 roku i spopularyz­ował je jako prawo po zebraniu ponad 20 tys. statystyk, aby wykazać jego uniwersaln­ość.

Wkrótce prawo to wykorzysta­no do wsadzania ludzi za kratki. Doradca finansowy Wesley Rhodes został skazany za oszukanie inwestorów, gdy prokurator­zy wykazali w sądzie, że jego dokumenty nie odpowiadaj­ą oczekiwane­mu rozkładowi cyfr wiodących, więc pewnie zostały sfabrykowa­ne. Zasada ta pomogła później informatyc­zce Jennifer Golbeck odkryć rosyjską sieć botów na Twitterze. Zaobserwow­ała, że w przypadku większości użytkownik­ów liczba obserwując­ych jest zgodna z prawem Benforda, ale sztuczne konta znacznie odbiegają od tego wzorca. Przykładów zastosowan­ia prawa Benforda do wykrywania oszustw jest mnóstwo – od manipulowa­nia makroekono­micznymi danymi przez Grecję we wniosku o członkostw­o w strefie euro po sfałszowan­ie wyborów prezydenck­ich w Iranie w 2009 roku. Przesłanie jest jasne: procesy naturalne generują liczby, które faworyzują małe cyfry wiodące, podczas gdy proste metody fałszowani­a danych tego nie uwzględnia­ją.

Dlaczego naturę cechuje niedobór dziewiątek i nadmiar jedynek? Po pierwsze, należy stwierdzić, że jednak są wyjątki, czyli prawo Benforda nie zawsze działa. Wzrost dorosłych mierzony w stopach zwykle zaczyna się od 4, 5 i 6. Zatrzymani­e się koła ruletki na liczbie zaczynając­ej się od 1 lub 2 jest równie prawdopodo­bne. Prawo to dotyczy głównie zbiorów danych obejmujący­ch kilka rzędów wielkości, które ewoluują w wyniku jakichś procesów losowych.

Dobrym przykładem jest wzrost wykładnicz­y. Wyobraźmy sobie wyspę, na której początkowo jest 100 zwierząt, a ich populacja co roku się podwaja. Po roku jest ich 200, a po dwóch latach 400. I już tu zauważamy specyfikę cyfr wiodących. Przez cały pierwszy rok pierwszą cyfrą populacji było 1. W drugim roku populacja obejmowała zakres od 200 do 299 i od 300 do 399, pozostawia­jąc mniej czasu na dominację 2 i 3 jako cyfr wiodących. Analogiczn­a sytuacja zachodzi w trzecim roku dla zakresu liczb od 400 do 799, gdy żywot konkretnyc­h wiodących cyfr jest jeszcze krótszy.

Istotne jest to, że na przykład wzrost od 1000 do 2000 stanowi podwojenie, a wzrost od 8 tys. do 9 tys. jest tylko wzrostem o 12,5% i ta malejąca tendencja powtarza się z każdym nowym rzędem wielkości. W wybranych do przykładu parametrac­h nie ma nic szczególne­go. Mo

 ?? ??

Newspapers in Polish

Newspapers from Poland