Если каждой букве алфавита присвоить свою цифру (А=1, Я=32/33), то значит ли это, что в числе Пи обязательно окажется полный текст собраний сочинений Ленина в правильном порядке? Ведь вероятность-то ненулевая?

Извините за дурацкий вопрос.

GD Star Rating
loading...

151 Responses to Вероятность

  1. M2yod:

    Там даже фильм Матрица в divx кодеке можно найти, если что.

  2. M2yod:

    Гоблинском, конечно. Про фашистов.

  3. R_alo:

    в каком переводе?

  4. Zvnre:

    Так и есть, найдётся. Например, слово «мама» (14 1 14 1) нашлось на 372 647 знаке после запятой.

  5. R_alo:

    не с того слова поиск начал

  6. Zvnre:

    а то слово позже встречается в первый раз, на 2 499 747 знаке после запятой только.

  7. Yddon:

    интересней вопрос, как в таком случае вытаскивать не то, что мы знаем, а то, что не знаем. например, будущий бестселлер 2020 года по версии Амазон.

  8. Yddon:

    ну, то есть, даже просто любой осмысленный текст, который пока еще не был произведен человеком

  9. Iribad:

    Ну я взял условный шифр, конечно, но все же.

  10. Zvnre:

    сложная это задача — очень много знаков числа пи знать нужно. Одно слово найти — не проблема, а вот фразу «мама мыла раму», например, я уже не нашёл в известных знаках этого числа.

  11. Zvnre:

    ну так вот, и «мама», и слово из трёх букв нашлись, значит и Ленин найдётся.

  12. Letunes:

    Для настоящего генератора случайных чисел — ответ «да» для бесконечного количества времени.

    Теорема: требуется доказать эквивалентен ли генератор случайных чисел детерминированному иррациональному числу. Пи — в частности.
    (понятно, что на практике такой детерминированный «генератор» никому не нужен)

    Можно вспомнить частотный анализ русского языка. Построить распределение вероятностей символов для сочинений Ленина.
    Потом построить для числа Пи для отдельных участков. Если корреляций нет, всё похоже на Гаусса, то…
    а дальше я не знаю.

  13. Yddon:

    тут еще вопрос — как декодировать. например, 121 — то ли «ла», то ли «уа». ну и да, вычислительные мощности ого-го нужны

  14. Peein:

    Ну, с формальной точки зрения это конечно еще не доказано, а в реальности так оно наверняка и есть.

    Только вот для того, чтобы записать номер знака, начиная с которого в числе пи будет полное собрание сочинений Ленина понадобится столько же места, сколько и для самих сочинений Ленина.

  15. M2yod:

    …в общем случае. В частном может так совпасть, что сочинения Ленина начинаются на пару знаков (или даже на пару порядков, что в таком числе особой разницы не имеет) раньше.

  16. Esuko:

    чтобы записать логарифм от логарифма номера

  17. Peein:

    .. при этом само слово «мама», если его рассматривать как число в 31чной системе, равно 357864.

  18. Peein:

    Нет, именно сам номер. Если предположить, что знаки Пи действительно идут равномерно распределенными, это даже не очень сложно формально доказать. Грубо говоря, для получения требуемой комбинации к бит из равномерного генератора в среднем нужно будет запустить генератор порядка 2^к раз, т.е. номер удачного запуска будет как раз к-битным.

  19. RogRU:

    Вот типа есть два способа компактно изложить полное собрание сочинений Ленина. 1) Поделить длину окружности на радиус и в полученном числе начать считывать текст с N-го знака. (Как нам тут верно подсказывают, есть риск, что само N по числу знаков будет порядка объёма полного собрания сочинений) 2) Ужать зипом полное собрание сочинений. Предположу, что 2) обгонит 1) на много порядков как по эффективности, так и по скорости.

  20. RogRU:

    хохо. исходя из собрания Ленина я почти сформулировал теорему Шеннона!

  21. O2rko:

    Разве из бесконечности дробной части обязательно следует, что там есть любая наперед заданная числовая последовательность?

  22. M2yod:

    Нет, конечно. Бесконечности дробной части для этого не достаточно.
    Число еще должно быть иррациональным и трансцендентным.
    Пи — такое число.

  23. Ragpp:

    с другой стороны надо подходить к проблеме.

    надо команде опытных шифровальщиков (из спецслужб какой-нибудь мощной сверхдержавы) отдать длинную последовательность цифр числа пи. а чтобы они не выкупили в чем дело, начать знака с пятидесятого.

    и сказать чтобы работали быстро, потому что дело государственной важности и мирового значения. и каждый день ходить проверять и всячески нагнетать обстановку.

    через неделю че-нибудь да расшифруют.

  24. Peein:

    нет, чтобы там следовала *любая* наперед заданная числовая последовательность, недостаточно быть иррациональным и трансцендентным.

  25. M2yod:

    А что еще нужно?

  26. Peein:

    Не поверишь, нужно чтобы там следовала любая наперед заданная числовая посделовательность. Доказать такое свойство ни для одного числа пока не удалось.

  27. Peein:

    (это свойство называется «нормальностью». «нормальность» конечно подразумевает иррациональность, но не обязательно трансцендентность).

  28. M2yod:

    Но с другой стороны никто не доказал обратного! 😉

  29. RARko:

    если шифровали одноразовым блокнотом, то найти не проблема, главное не говорить где блокнот взял.

  30. RARko:

    и о чём это говорит?

  31. M2yod:

    Что теоретически это возможно.

  32. Rotall:

    > Грубо говоря, для получения требуемой комбинации к бит из равномерного генератора в среднем нужно будет запустить генератор порядка 2^к раз…

    Это не так. Для некоторых комбинаций k бит в среднем (в смысле математического ожидания числа шагов) нужно 2k+1?2 запусков, прежде, чем последовательность «проявится» (т.е. минус k до того, как «начнётся»). См. Г. Секей «Парадоксы в теории вероятностей и математической статистике», стр. 60 (69 в djvu-файле), пункт «в) Парадоксы, связанные с бросанием монеты»:
    https://mega.co.nz/#!shoHlCwB!ASJufEO3I3 QOMM9Y14_3nkQcVl1LKyB8fWzjGqqBjRE

  33. RARko:

    никто обратного и не говорил

  34. WodMsk:

    О бесконечных обезъянах речь?

  35. KIRef:

    Удивительно, что подобным вопросом я задался тоже некоторое время назад, при этом не занимаясь ничем, связанным с математикой в жизни. Но как так? И я задал этот вопрос достаточно продвинутому математику, тем самым инициировав его так, что дальнейший разговор я не понял, и все время хотел перебить его с криками «остальновись МАТ МАТ МАТ!!!!».

  36. Peein:

    Конечно речь идет о порядке величин, и разницы между 2^k и (2^k-1) в этом смысле никакой нет. А так да, «грубо говоря» там приписано именно ради этой оговорки (разве что можно еще грубее рассматривать ситуацию, где генератор тупо запускается независимо для каждых к бит).

  37. NuSin:

    кстати да, про корень из двух как ситуация?
    может уже доказано что не, а я отстал от жизни. кто-то знает?

  38. Peein:

    Про нормальность пока вообще никто ничего ни про что не доказал.

  39. O2rko:

    Дело в том, что в какой-то книге (весь день думал в какой именно, но так и не вспомнил) утверждение «где-то в дробной части числа пи идут 20 семёрок подряд» приводилось как пример высказывания, которое не является ни истинным ни ложным, но в то же время не содержит парадокса, вроде эпименидовского.
    Я не спец в теории чисел, но думается мне, что автор знал, о чем пишет, то есть существование любой заданной последовательности в дробной части пи на данный момент не доказано.

  40. Amtite:

    а представь, что по дробной части числа Пи разбросаны моря нулей длиной Гугол цифр. Считаешь, считаешь, и тут вдруг оп — гугол нулей тебе. А потом единичка, семёрка и дальше число Грэма нулей! Вот смех-то!

  41. Inider:

    с такими перспективами число Пи надо запретить, на всякий случай. А то мало ли кто там что нароет.

  42. RogRU:

    точно. А ещё число е и корень из двойки!

  43. Inider:

    Приходят к тебе копирайтеры на предмет нелегального фильма скачанного из сети интернет, а ты такой: да нет же, любезные, это не фильм, это три миллиарда цифр числа Пи, начиная от такого-то знака. Они быстро по своей базе проверили, извинились и ушли, оставив на память визитки.

  44. Inider:

    е можно оставить, его мало кто понимает, а корень да — концентрированное зло в чистом виде

  45. Rotall:

    >> с такими перспективами число Пи надо запретить, на всякий случай.
    > точно. А ещё число е и корень из двойки!

    Запрещать корень из двойки — баян. Пифагорейцы даже было забанили некоего Гиппаса за это дело.

  46. 17xer:

    «нормальность» подразумевает более сильное свойство: не только наличие любой последовательности, но и её равномерную «встречаемость».

  47. Peein:

    Да, именно исходя из этого и можно сделать заключение про номер знака, начиная с которого встретится собрание сочинений Ленина.

  48. Peein:

    О, я придумал! Определим число 0<= z_n < 1 таким образом, что двоичные разряды (k*n … (k+1)*n) в нем в точности равны двоичной записи числа к. Теперь про любой нелегальный фильм можно заявить, что это в точности знаки этого числа начиная с позиции х (где х — сам фильм).

  49. M2yod:

    Ничего смешного, между прочим. В нашей с вами реальности (а не в фантазиях антиутопий) вполне себе существуют запрещенные числа.

    Так что если очень сильно будет нужно, запретят и Пи и корень из двух, и множество рациональных чисел между 0 и 1.

  50. Emoam:

    зашел в пост узнать вероятность

  51. M2yod:

    Скажем так — существует ненулевая вероятность, что в числе Пи с ненулевой вероятностью окажется полный текст собраний сочинений Ленина в правильном порядке.

    Это так называемая первая производная вероятности.

  52. Lepode:

    Хитрости начинаются в слове «изложить». Для того, чтобы «компактно изложить» вторым способом сочинение своим коллегам из Тау Кита, предварительно необходимо будет передать им дистрибутив убунты, исходники анзипа и спеки на процессор. После чего ждать, пока коллеги научатся варить кремний. Сомневаюсь, что это обгонит первый способ.

    Поэтому предлагается третий способ — необходимо создать соответствующим образом составленный Словарь Важных Словосочетаний (можно использовать уже набранный блогерами в этом треде)

    1) мама
    2) многочлен
    3) полное собрание сочинений Ленина
    4) джигурда

    После чего любое важное словосочетание элементарно передается двумя битами

    1–1–2–3!

  53. Peein:

    Ура! Ты в одном шаге от LZW*

    * (тот же гзип, в общем-то).

  54. Peein:

    ты уверен, что такая вероятность существует? Какова вероятность того, что ты прав?

    Продолжаем брать производные, не останавливаемся!

  55. Lepode:

    ну щас прям. Я их всех троих вместе с Хаффманом превзошел значительно. У меня неадаптивное сжатие с предопределенным словарем, за счет чего коэффцициент сжатия достигает примерно гугол к одному (особенно для собрания сочинений).

    (если у коллег с Тау Кита нет аналогичного словаря — не коллеги они нам, ящитаю)

  56. Peein:

    ЛЗВ в классических реализациях тоже словарь юзает. А коэффициент сжатия у тебя вполне обычный получится, не надо ляля.

  57. Amtite:

    скорее, от иероглифического письма 🙂

  58. Iribad:

    Фактически, я правильно догадался в первом приближении, что это возможно. Но вопрос теперь даже больше в том, как вычислить эту вероятность, возможно ли это? Как современная наука работает с предполагаемыми бесконечностями?

    Можно перефразировать даже так — если засадить за вычисление знаков после запятой конкретную ЭВМ, в какой срок она достигнет точности, равной, например, количеству атомов в наблюдаемой Вселенной? Это число конечно, в итоге, значит, можно уже искать в нем?

  59. Inider:

    начнем с того, что для записи одного байта физически нужно больше одного атома, значит эвм, способная выразить результат с точностью равной количеству атомов во вселенной, размером будет в разы больше той самой вселенной.
    Это только записать. А еще процессор нужен, вентилятор и корпус. Особенно доставляет корпус, способный уместить в себе несколько вселенных. Интересно, где для него материала взять достаточное количество?

    Короче, не шути со Вселенной, %username%

  60. Iribad:

    «для записи одного байта нужно больше одного атома»

    Почему??

  61. Inider:

    а самому подумать?

  62. Amtite:

    например, в той ГиперВселенной, в которой существует наша Вселенная, если рассматривать Вселенную, как шарик, родившийся после Большого Взрыва и ограничиваться нашими четырьмя измерениями.

  63. Inider:

    я не могу спорить о том, чего не понимаю.

  64. Odaekb:

    присоединяюсь к вопросу, подумать пробовал — не помогло…

  65. Inider:

    Инфраструктурас.
    Записыватель, считыватель, передать процессору, принять от процессора, доставить энергию. Хранить эти атомы надо где-то, а сейчас они просто во вселенной разбросаны, так что и не найдешь нужный. Далее, моя традиционная шутка про корпус для такого устройства.
    Еще можно вспомнить что отдельные атомы больше подходят для записи битов, а для байтов их нужно больше в десяток раз.
    И это я еще не касался вопроса бита четности. Кроме того, раз у нас вся вселенная ушла на выражение самой себя, то куда записать программу обработки?
    При всей бесконечности вселенной, изнутри она непознаваема, в ней просто не хватает на это ресурсов.

  66. Iribad:

    Я тебя не понял просто.

    Почему ты говоришь о байтах? Вот, например, возьмем бит — единицу информации. И один электрон, например, содержит 2 бита информации — не знаю, в зависимости от его спина, например. В итоге мы имеем?..

  67. Inider:

    а почему бы тебе не кодировать информацию пролетающими в небе стаями гусей? Крылья вверх — единица. Это даже проще чем электронами, достаточно познакомиться с хорошим орнито-психологом и дрессировщиком. Беда в том, что твои гуси могут улететь, точно так же, свой электрон без вспомогательных устройств ты никогда не найдешь. Но поскольку ты задал в условиях задачи точность равную всей вселенной, то у тебя ни на что больше не останется материи. Каждая частичка будет выражать саму себя, даже клочка бумажки не останется, чтоб записать ответ.

  68. Odaekb:

    вас, впрочем, тоже

  69. Odaekb:

    Вас понесло.

  70. Iribad:

    Ну почему же, я предполагаю и спрашиваю у корифеев ответ, а меня к орнитологам посылают 🙂

    Короче — может ли ЭВМ записать столько же бит информации, сколько есть атомов во Вселенной?

    Кто здесь власть? Да или нет?

  71. Inider:

    краткий ответ — нет.
    Записать количество бит равное количеству атомов невозможно. Можно лишь их сосчитать(или прикинуть) и записать количество

  72. Inider:

    не вижу изъяна в логике.

  73. Odaekb:

    Ты видишь суслика? Я может тоже не вижу. Но он там есть!

  74. Iribad:

    Ну это да, для этого хватит клочка бумаги, карандаша и терпения.

  75. Odaekb:

    Ответ настолько многослойный, что однозначное «да» или «нет» тут глупо.
    Технологически в обозримом будущем — нет.
    Теоретически? Ограничение будет на гравитационный коллапс и разогрев такой системы. Но если ее делать размером с обозримую вселенную, то тогда мы сможем наблюдать человечество в любом масштабе времени, в прошлом и будущем. Например два сола назад слай хотел еще раз внимательно рассмотреть,что делал Йован вовремя балканизации.
    еклмн, великий гугл, кажется я спалился…

  76. M2yod:

    > начнем с того, что для записи одного байта физически нужно больше одного атома

    И тут же закончим. Это не так.
    Максимальная теоретическая плотность информации, которой сегодня оперируют физики (например при расчетах энтропии черных дыр) является 1 бит на кубик пространства планковских размеров.

    Можно ли записать (или хотя бы теоретически иметь) плотность информации большую? Учены покуда в непонятках.

    Но сам понимаешь, разница между 1 бит на атом и 1 бит на планковский кубик — порядки порядков.

  77. Inider:

    хохохо, узнаю свое отражение.
    Всё-таки, мне кажется, кодировать гусями лучше и гуманнее.

  78. Inider:

    ну как же без этого

  79. Inider:

    а кто тут говорил о плотности записи информации? Ну, кроме тебя, конечно?

  80. M2yod:

    Ну, я указал теоретический предел на сегодняшний день.
    Все, что ниже этого предела — теоретически осуществимо.

    А значит для записи одного байта теоретически достаточно планковской длины.
    Практически мы УЖЕ СЕГОДНЯ можем записывать информацию 1 байт — 1 атом. А впереди — еще не паханное поле миниатюризации, т.е. увеличения плотности хранения инфы.

  81. Inider:

    ты забываешь, что вопрос стоит не «что мы можем», а «можно ли записать все, что есть во вселенной», и как раз поэтому скатываешься в не нужную здесь миниатюризацию.

  82. Iribad:

    Я тоже об этом прочитал, о том, что на горизонте событий черной дыры можно зашифровать херову гору информации и т.п. Но ведь «тру» или «фолс» надо обозначать как-то в системе расчета, верно? И как на планковском размере мы будем СЧИТЫВАТЬ тру или фолс? А, а?

  83. Inider:

    сегодня мы можем записать один атом с помощью устройства размером с книжный шкаф. Чтоб таким образом записать все атомы, нам понадобятся все атомы плюс устройство размером с книжный шкаф. Улавливаешь разницу?

  84. Inider:

    маленькое уточнение, считывать нам предлагают из дыры, что тоже немало доставляет.

  85. Odaekb:

    Иногда проще перевести полу-дурацкий вопрос в шутку, ага
    Но, к вопросу — когда я говорил о многих битах на атом, я имел ввиду что-то типа ядерных спинов с большим модулем.
    Если спин будет, скажем, 9/2 — то у него будет 9 стационарных значений — 3 с небольшим бита.
    В свое время о памяти на ядерных спинах любили говорить интеловские теоретики, как о системе позволяющей обойти их оценки энергии на бит; не уверен, что оно ушло с мертвой точки.

  86. Odaekb:

    один байт — 1 атом? Как именно?

  87. Iribad:

    Он биты с байтами перепутал просто. Вот выше ты про спины говорил — так я то же самое предположил. Можно ведь считать спин за 1 или 0 или даже 2?!

  88. M2yod:

    А я что, «байт» написал? Вот ведь осел! Бит, конечно…

  89. M2yod:

    : : Ха, ха. Поржал, поржал…

    Для того, чтобы записать 1 ТБ данных на терабайтный винчестер необходим компьютер размером, скажем, со стандартный корпус системника ATX.
    Значит, чтобы записать 1000000 ТБ данных на 100000 винчестеров, нужен компьютер размером с гору, да?
    Или достаточно того же самого системника, не?

  90. Inider:

    Господи, да что с тобой? Ты очень не внимателен.
    — «нам понадобятся все атомы плюс устройство размером с книжный шкаф», — я не знаю как это можно прочитать иначе, я здесь второго смысла не вижу.
    Давай, ты отдохни немного, а я постараюсь тебе не отвечать, чтоб не провоцировать. А потом, если еще будет нужна помощь, мы сможем продолжить.

  91. M2yod:

    Я вообще не про черные дыры разговор вел, а про теоретический предел плотности записи информации.

    При такой плотности, всю информацию о всех атомах и даже всех элементарных частицах Вселенной и всех их свойствах (импульс, заряд, спин, все дела) можно будет (теоретически!) хранить в кубике размером сантиметр на сантиметр на сантиметр. Или даже на 10 меньше ниже, кто там считает…

    Теперь стает вопрос, если у нас есть вся информация о всех свойствах всех элементарных частиц Вселенной (в пределах квантовой неопределенности) — достаточно ли этих данных для «полной оцифровки Вселенной», или нам понадобятся так же информация о более мелких, но покуда неизвестных науке частицах (струнах, бранах и прочий булщит…)

    Ответ — нет. Не достаточно.

    Но уже можно будет говорить о «детализации оцифровки Вселенной». Что и происходит в современных компьютерных играх, скажем сравните детализацию графики сегодняшней игры, и то, что было 20 лет назад.

    А когда этой детализация будет достаточно, чтобы неподготовленный человек с невооруженным глазом (или даже подготовленный человек с вооруженным глазом) не сможет отличить оцифрованную Вселенную от оригинальной — вот она, победа!

    Ставлю на то, что подобной детализации можно будет достичь даже близко не приближаясь к теоретическому пределу плотности — бит на планковский кубик.

  92. M2yod:

    Да не нужны нам все атомы вселенной!
    Потому что изначальный твой постулат «1 бит = 1 атом» — неверен. И ты построил на этом постулате не правильную теорию.

    Я тебе говорю, чтобы записать информацию о всех атомах Вселенной нужен 1см3 пространства. И устройство, размером с книжный шкаф. Или даже с Солнечную Систему, не суть.

  93. Inider:

    хорошо, хорошо. Попей воды, яд пока не добавляй.

  94. M2yod:

    Или даже на 10 меньше ниже, кто там считает…

    меньше -> порядков

  95. Kitekb:

    Я так понимаю, там даже окажется весь этот пост, включая еще ненаписанные остроумные ответы на мой комментарий.

  96. Odaekb:

    Более того — если ты возьмешь большое стадо обезьян, дашь им по клавиатуре -то через некоторое время они напишут и все твои посты, и все твои комментарии — включая и те, на которые у тебя не хватило остроумия.
    Подумай, %username%, тот ли ты венец эволюции, которым ты хотел себя видеть?

  97. M2yod:

    В этом и есть вся суть эволюции.
    Один толковый человек за клавиатурой заменит бесконечное количество обезьян, работающих бесконечное количество времени.

    Или возьмем нашу ситуацию. Один AI (бывш. Интернет) скоро заменит 7 миллиардов примитивных людишек с клавиатурами.

  98. Odaekb:

    Слава Великому Гуглю! Слава! Слава!

  99. Iribad:

    Ты поясни, как ты на планковской величине 0 от 1 отличать будешь, вот что важно.

  100. M2yod:

    Так это же теоретический предел плотности информации. Понятно, что на практике до такого пока далеко.

    Но ведь и на практике (хоть и теоретически покуда, т.е. не подтвержденно) черные дыры как-то же это делают!

    Информация, заключенная в черной дыре количественно равна размеру площади поверхности горизонта событий в квадратиках плаковских длин. Это не ко мне, это к Хокингу, за разъяснениями, если что.

  101. Rumekb:

    да что же оно доставляет то?!

  102. Iribad:

    Я знаю, но вопрос-то не снимается. Хоккинг не мог такое ляпнуть, не дав где-то объяснения ТЕОРЕТИЧЕСКОГО способа отличения 0 от 1 на таких величинах, иначе это бессмысленно вообще.

  103. Inider:

    считывать информацию из такого устройства лучше всего, как и из любой другой сингулярности, командой
    cat /dev/null

  104. Nivead:

    Вспомнил о родственной проблеме. Есть такой «парадокс молчания Вселенной» — по последним данным у многих звезд есть планеты, вероятно есть и с подходящими условиями для возникновения жизни. Следовательно, обитаемых планет должно быть дофига. Но мы слушаем звезды и почему-то слышим лишь нихуя. Никаких теблогередач или радиообмена между пятым галактическим флотом и десятой эскадрой разрушителей планет.

    Последний абзац как раз про сочинения Ленина:

    Физик Марк Ньюман (Mark Newman) совместно с биологом Михаэлем Лахманном (Michael Lachmann) из германского Института имени Макса Планка в Лейпциге и специалистом по компьютерам Кристофером Моором (Cristopher Moore) из Университета Нью-Мексико (University of New Mexico) в Альбукерке развил некоторые идеи, касающиеся передачи данных с помощью электромагнитных волн, высказанные еще в 40-х гг. прошлого века Клодом Шенноном (Claude Shannon).

    Новая работа, опубликованная в American Journal of Physics, носит наименование «The Physical Limits of Communication, or Why any sufficiently advanced technology is indistinguishable from noise» («Физические Пределы Связи, или Почему любая достаточно развитая технология неотличима от шума»).

    Как показал в свое время Шеннон, если поставить своей целью передачу сообщений с наибольшей эффективностью, то для случайных наблюдателей, не знакомых с языком послания и ненароком перехвативших такую «весточку», она не будет отличаться от случайного шума в приемнике. Так, если по электронной почте передавать сообщение, состоящее из малого числа знаков — например, «AAAAA», — то оно, очевидно, будет содержать очень немного информации, потому что читатель, видя ряд повторяющихся букв, сможет легко предположить, что следующим знаком, вероятно, станет также буква «A» (новой информации он при этом — при передаче очередной буквы «A» — не получит). В этом примере текст сообщения выглядит совершенно неслучайным. С другой стороны, сообщение, начинающееся с последовательности вроде «RPLUOFQX», с теоретической точки зрения содержит «много информации», поскольку мы уже не сможем с прежней легкостью предсказать продолжение. Как это ни парадоксально, именно «абсолютный беспорядок», не содержащий с нашей точки зрения никакой внятной информации вообще, может оказаться самой концентрированной информационной передачей, и, с другой стороны, с формальной точки зрения именно непредсказуемый шум может считаться источником самой эффективной информации. Если неизвестен способ кодирования, использованный в таком сообщении, то мы никак не сможем выявить разницу между информационно богатым сообщением и случайным беспорядком в письме.

    На обыгрывании этой темы было создано огромное количество художественных произведений, как в компьютерную, так и в «докомпьютерную» эру. Достаточно припомнить любую комедию с очередным Иваном Дураком или сумасшедшим, чьи случайные и (на самом деле) бессмысленные слова и поступки в глазах «перемудривших» окружающих наделялись недоступным им самим высшим смыслом. Да и в условиях нашей действительности способность «разумных существ» наделять смыслом любой случайный «событийный шум» порождает целый ряд самых разнородных явлений — от «конспирологических» теорий и кабалистических построений до толкований сновидений, нострадамусов, астрологии и наделения «харизмой» бездарных политических деятелей, совершающих исключительно бессмысленные поступки.

    Классическим в этом смысле считается рассказ Раймонда Джоунса «Уровень шума», повествующий о том, как с помощью банальной мистификации и библиотеки, набитой случайным набором книг, ученых умников вынудили «изобрести заново» антигравитационный двигатель.

    Ньюман и его сотрудники показали, что все вышесказанное справедливо и в случае радиоволн, посредством которых мы собираемся связываться с «братьями по разуму». Когда электромагнитные волны используются в качестве среды передачи информации, то наиболее эффективный с информационной точки зрения формат сообщений неотличим от обычной тепловой радиации — это тот же самый вид радиоволн, что испускаются разогретыми телами, подобными звездам. Другими словами, эффективно закодированное радиосообщение, приходящее к нам из космоса, неотличимо от «сигналов», непрерывно посылаемых нам любой обычной звездой (разумеется, все это справедливо в том случае, если передача не предназначена специально для нас, т.е. еще неведомых инопланетянам разумных существ, которых требуется сначала обучить коду).

    У этой версии есть и обратная сторона. Представьте, что какие-нибудь инопланетяне решили собрать доказательства того, что на Земле появилась техногенная цивилизация. Чтобы подобное начинание имело успех, им нужно было бы поторопиться — ведь время с начала радиовещания с Земли и до того момента, как наши радио — и телевизионные сигналы станут повсеместно и эффективно кодироваться, чтобы зря не засорять эфир (и мы сами тогда «превратимся в звезду»), по космическим масштабам ничтожно мало. И только в этот ничтожно малый период наша техногенная деятельность будет легко различима с других звезд.

    В конце концов, говорит Ньюман, в 12-миллиарднолетней истории Вселенной велика вероятность того, что внеземные цивилизации — если они существуют в достаточном количестве — уже длительное время поддерживают связь друг с другом, уж во всяком случае гораздо дольше, чем наша несерьезная 80-летняя история радиовещания. В таком случае они наверняка приучились не растрачивать попусту энергию и кодировать свои передачи достаточно эффективным образом, сжимая данные. А для нас эти передачи все равно, что не существуют.

    По этому поводу можно заметить, что никакая сколь угодно эффективно закодированная передача не обходится без «служебных пометок». И в этой «сопроводительной записке» полагается по крайней мере указать, какой именно «продвинутый кодек» был использован в данном конкретном случае и кому сей «мессидж» в результате предназначался (а иначе, при «абсолютном кодировании», применив произвольный «абсолютный кодек» из некоего заранее заготовленного набора, из любого шума можно будет получить какое-нибудь произвольное, насыщенное абсолютно новой информацией послание). К тому же цивилизация, привыкшая «считать килобайты», наверняка и не «выкручивает» мощность своих передатчиков свыше необходимого для более-менее эффективной передачи предела. А в этом случае им нужно будет подстраховаться еще и некоторым количеством избыточной информации, необходимой для того, чтобы адресат смог в случае чего успешно восстановить утерянные в звездных теснинах куски «немного подпорченного» послания. Возможно, именно на поисках такого рода «служебной информации», выпадающей из модели обычного шума, и следует сосредоточиться будущим исследователям внеземного разума.

    Согласно еще одной идее, в которой наукой уже и не пахнет, цивилизация, научившаяся создавать «абсолютные кодеки», ни в каких «братьях по разуму» уже попросту не нуждается. Действительно, им достаточно будет применить к первому попавшемуся шуму (хотя бы от тех же звезд) любой свой «суперкодек» — и тем самым не только породить новое знание, но и как бы «сгенерировать», вызвать из небытия новую, неведомую доселе цивилизацию со своим языком и культурой. Среди этих фантомов немудрено и потерять действительно реально существующих «чужих».

  105. Inider:

    знания, полученные мудрецами в медитации и записанные на бумажке для более тугодумных собратьев мы отрицаем, а читать то же самое из шума готовы ломануться прямо сейчас. А объяснить в чем разница не можем. Прелэстно.

  106. Inider:

    пардон свин, не ты отрицаешь и не ты готов ломануться, предыдущая реплика безадресна, направлена к звездам.

  107. Peein:

    Первый обнаруженный пульсар был условно обозван «LGM» — little green men, т.к. к тому моменту четкая периодичность сигнала ничем кроме «инопланетяне» не объяснялась. Но потом обнаружилось, что просто, мол, нейтронная звезда вращается. При этом вполне может быть, что в космосе нет звезд, которые благодаря какому-то примитивному процессу способны слать нам что-то в духе ABCD на морзянке. И если уважающая себя цивилизация хочет наладить контакт, что-то вроде такого она и будет отсылать в космос. Я не вижу как в этом случае возникнет проблема «неотличимости с шумом».

  108. Odaekb:

    по мнению некоторых гуру, идеальный компьютер должен выдавать правильный результат вычисления 2+2 с вероятностью 70%

  109. Nivead:

    вот именно, «если уважающая себя цивилизация хочет наладить контакт».

  110. Inider:

    прямо вижу, как мы, желая наладить контакт с муравьями, придумываем специальные ароматические сигналы, раскладываем вблизи муравейников хитрые диспенсеры, отдаленно напоминающие квазары, а эти твари в первую же ночь все сожрали.

  111. Leopold:

    науканы, несмотря на бесконечность числа пи (например) и конечность (к счастью) сочинений ленина, наблюдается некоторый парадкс (который, я так думаю, может перетянуть доказательства в сторону, что сочинений ленина там не будет):
    если число пи натуральное (правда, где тот период минимальный-максимальный, по которому считают натуральность), то сочинения ленина-то ненатуральны (о чем как минимум говорит частотный анализ русского языка и прочие умные… ну вы поняли), то есть, если допустить, что сочинения там есть (и еще одно условие-допущение-допонимание: я так понимаю, что там должны быть закодированы все сочинения подряд, без разрывов и случайных символов? иначе ж это бессмысленно?). то есть, собрание сочинений если там и появится, то с некоторыми серьезными допущениями.

  112. Inider:

    если подходить основательнее, то в числе пи должны найтись не только точные копии собраний сочинений (не одна, а именно что бесеконечное количество экземпляров), но так же и почти точные копии с одной-двумя опечатками, и копии с недостающими страницами, и с недостающими томами, и в кривом переводе на все языки мира, и в хорошем переводе тоже.
    Если принять во внимание все выше сказанное, то можно заключить, что число Пи состоит из сочинений Ленина лишь чуть меньше чем полностью.

  113. Nivead:

    Как уже заметил , проблема возникнет, если внеземная цивилизация не возжелает вступать в контакт с муравьями.

    Например, четко видно, что человечество постоянно совершенствует методы радиосвязи, появились методы расширения спектра:

    http://ru.wikipedia.org/wiki/DSSS

    Еще одно чрезвычайно полезное свойство DSSS-устройств заключается в том, что благодаря очень низкому уровню мощности своего сигнала они практически не создают помех обычным радиоустройствам (узкополосным большой мощности), так как эти последние принимают широкополосный сигнал за шум в пределах допустимого. И наоборот — обычные устройства не мешают широкополосным, так как их сигналы большой мощности «шумят» каждый только в своем узком канале и не могут целиком заглушить весь широкополосный сигнал.

    Использование широкополосных технологий дает возможность использовать один и тот же участок радиоспектра дважды — обычными узкополосными устройствами и «поверх них» — широкополосными.

    Сейчас появилась такая штука как UWB (сверхширокополосные сигналы) — они занимают гигантский кусок диапазона и позволяют передавать данные с высокой скоростью, используется в беспроводных HDMI мостах, например.

    И у меня есть подозрение, что если мы покажем работающий линк в CDMA DSSS или UWB ученому из 50х годов прошлого века, он вообще не сможет определить, что эти устройства что-то излучают (пока не залезет внутрь).

  114. 4nelite:

    А есть такая книга, где записано то число, по которому ее можно найти в числе пи?

  115. Odaekb:

    Есть, она записана в числе sqrt(2)

  116. Peein:

    Однобуквенная книга «5» содержит то число, по которому ее можно найти в числе пи.

  117. Rumekb:

    это понятно, а доставляет-то что?

  118. Iribad:

    Если следовать такой логике, то число Пи состоит из всего, что можно зашифровать в цифровом виде, чуть более, чем полностью.

  119. Iribad:

    Тут, кстати, мы вернемся к вопросу, является ли математика объективной реальностью Вселенной, или просто удобной для нашего класса наблюдателей абстракцией.

  120. Inider:

    не, если для тебя это ежедневная практика, то конечно я не смогу объяснить тебе свою восторженность.

  121. 17xer:

    Ну так что же, про нормальные числа пока неизвестно, но чтобы хотя бы по разику любая последовательность встречалась в трансцендентных числах типа Пи, доказали уже?

  122. Iribad:

    С математикой в посте туго, у нас тут своя атмосфера!

  123. Lepode:

    в словосочетании «неадаптивное сжатие с предопределенным словарем» ключевыми являются вовсе не слово «словарь» или предлог «с», а слова «неадаптивный» и «предопределенный». ЛЗВ адаптивный.

  124. Peein:

    да, но тем не менее предложенный тобой метод — всего лишь частный случай, поэтому я и говорю что ты в одном шаге.

    И нет, наличие «большого словаря» не позволит тебе достичь хорошего сжатия. Скорее даже наоборот, сжатие будет фиговенькое и уж точно похуже, чем в случае с адаптивным подходом.

  125. Peein:

    нет. В общем в трансцендентных числах не обязана встречаться каждая последовательность «хотя бы по разику».

  126. NamRU:

    На stackoverflow такой вопрос был. Там ответил кто-то, кто, по его словам, является рекордсменом мира по известному количеству знаков числа «пи» — у него на харде 1013 знаков хранится. И он на спор находит в этой последовательности произвольные номера соцстрахования.

    Там же есть комментарий со средними длинами «адреса» первого включения N-значных чисел. Этот адрес с хорошей точностью равен N, как и ожидалось.

  127. Kayank:

    а как тебе идея выбора частоты волны связи как частоты водорода с искусственным коэффициентом?

  128. Iribad:

    Какой нужен хард для хранения этого числа? С 1013 бит? 🙂

  129. Lamwet:

    Я могу точно сказать, чего в числе Пи не встретится: полного десятичного представления любого иррационального числа, кроме самого числа Пи.

  130. Inider:

    да нету никакого Пи.

  131. Eleega:

    Бро ты придул архиватор! Браво!

  132. Odaekb:

    10^13 знаков, при записи текстом — 1 байт — одна цифра 10 терабайт.
    Можно записывать 2 знака в байт — тогда 5 терабайт.
    Много, но не запредельно.

  133. M2yod:

    Я же уже давал ссылку на вычисления числа Пи. Там в том числе была ссылка на текущий (задокументированный и зарегистрированный) рекорд вычисления числа Пи.

    5 триллионов цифр, файл размером 8 Терабайт. Расчет велся на обычном домашнем компьютере, правда усиленном несколькими процессорами XEON, процесс расчета длился 90 дней.

  134. Odaekb:

    файл странно большой, получается почти 9 байт на 5 знаков. Ну пусть пробел после 5 знаков и LF/CR после 30.. все равно много. Контрольные суммы?

  135. M2yod:

    Ссылка же! Сходи почитай. Даже скачай себе файл и сам посмотри. 🙂

  136. Inider:

    вот бы его сжать джепегом. Кстати, не думаю, что кто-нибудь разницу бы заметил

  137. Odaekb:

    Зачем качать? Тебе самому слабо посчитать миллиончик-другой знаков??
    http://files.extremeoverclocking.com/fil

  138. Iribad:

    5 терабайт? Да у меня под порно только 3,5 терабайта стоит. Пустышка 🙁

  139. Odaekb:

    сразу видно настоящего блогера!

  140. Iribad:

    Да мне еще и не хватает, думаю не париться и поставить какой-нибудь рейд-массив терабайт на 10.

  141. 17xer:

    это доказано?

  142. Muiort:

    да, все 55 томов, только в обратном порядке.

  143. odin_pra:

    не встретится только в тривиальной кодировке. Но можно придумать такую кодировку, в которой в пи будут закодированы все десятичные представления всех иррациональных чисел, включая пи.

  144. Peein:

    Это несложно доказать. Если не париться формальностями, достаточно привести пример одного числа, которое (скорее всего) трансцендетно, но в котором не встечается ни разу последовательность «42». Формальное доказательство позануднее, но тоже не очень сложно.

  145. 17xer:

    ну да… взять, скажем, число «пи», из записи которого изъяты все единицы… но так не интересно.

  146. Odnko:

    сержант зануда напоминает: gz — это deflate, который есть гибрид LZ77 и Хаффмана, а не LZW.

  147. Peein:

    Здравомыслящему человеку LZ77 от LZ78 от LZW отличать не положено.

Добавить комментарий