После того, как Тому Крузу в фильме «Миссия невыполнима» на запрос «интернет» поисковик выдал три результата, возник идиотский вопрос: какова частота встречаемости цифр в интернете? Ответить на него легко, спасибо поисковикам. График от Google от сегодняшнего числа представлен на рисунке ниже.
Интересно, а можно ли какими–то причинами объяснить наблюдающееся затухание? Ну, за исключением нуля.

numbers of Google

GD Star Rating
loading...

18 Responses to После того, как Тому Крузу

  1. 05xela:

    Это имперический закон. //en.wikipedia.org/wiki/Benford%27s…

  2. Axyptak:

    Какой такой империи?(grammar nazi off)

    Кстати, в рунете всё не как у людей, если верить Яндексу:

    image

  3. Axyptak:

    Спасибо большое! Забавно, оказывается огромное количество каждодневных чисел распределены логарифмически. А частота цифр не зависит от системы исчисления, т.е. скейлинг работает.

  4. 05xela:

    Так будет если не вычленять цифры из больших чисел.

  5. Axyptak:

    Какое верное замечание. Не обратил внимания. Посмотрел свои запросы к Google для построения первого графика — он, как и Яндекс, тоже не вычленяет цифру из больших чисел. Как заставить их это сделать, не знаю.

  6. 05xela:

    Расскажу еще историю. Я узнал об этом законе, когда работал в контроллинге отдела качества одного крупного автопроизводителя.
    В одной из компаний человек из контроллинга решил проверить этот закон на суммах счетов. Обнаружил пики на 3 и 9. Начал ломать голову и выяснил — от 4000 евро нужна была подпись 2х человек. Поэтому очень много счетов выставлялись на 3999 много раз. Таким образом он поймал нечистых на руку.
    У нас была огромная база гарантийных выплат. Проверили — все как по учебники, никаких отклонений.

  7. Rumj:

    ты прав, это очень интересный закон. Я ещё где–то читал, что так можно проверять в каких–то документах выдуманы числа из головы или реальны. Естественно, при достаточном количестве чисел. При выдумывании человек примерно одинаково распределяет вероятность между цифрами. Там кстати даже не все цифры проверяются, а первая значащая в числе. Это ещё эффективнее.

  8. Rumj:

    кстати, вот Яндекс по первым значащим, грубо

    размер 454x265, 8.46 kb

  9. Axyptak:

    Интересно, всего два дня прошло, а график изменился. Видимо, робот Яндекса напал на сайт с несколькими гигабайтами телефонных книг.

  10. Axyptak:

    не два, а четыре, идиот.

  11. GgoDafla:

    судя по количеству 1 и 7 он просто напал на упячку.

  12. Rumj:

    ты имеешь в иду разницу между твоим и моим графиками? Так у тебя, вроде, просто по цифрам, а у меня по пробелу и цифре, типа, первая в числе.

  13. Axyptak:

    ага, я не обратил внимания.
    вообще он как–то странно ищет.
    на запрос 1 — 1036 млн,
    на запрос » 1″ — 1331 млн,
    на запрос «1 » — 1322 млн.
    Странно то, что в последнем случае выдаёт те же результаты, что и в предпоследнем, при этом подсвечивая «неверные» случаи, где цифра встречается в тексте, как «1.» или «1,». Не очень понятно, как работает внутренний парсер.

  14. 8dna:

    Цифры!!!111111111111111111111111111

  15. Agim:

    Я тут увидел этот пост и не мог пройти мимо. Обожаю, когда роботы работают за меня.
    $ for * in `seq 0 9`; do curl –s –A ‘Mozilla/5.0 (*11; U; Linux i686; en–US; 1.9.2.3) Gecko/20100402 Namoroka/3.6.3’ //www.google.ru/search?q=$* | sed ‘s/>/>\n/g’ | grep –a5 ‘Результаты <‘ | sed ‘s/ //g’ | tail –n1 | sed ‘s/<.*>//g’; done
    7890000000
    15020000000
    12540000000
    11040000000
    9750000000
    9420000000
    7960000000
    7230000000
    7180000000
    6400000000

  16. Agim:

    И да, мои результаты коррелируют 🙂

Добавить комментарий