Есть хороший гугловский сервис, высчитывающий частотность слов в литературе различных языков.
Забив различные слова, я обнаружил удивительное явление, касающееся самого, пожалуй, загадочного периода СССР: времени между Сталиным и Горбачёвым.
Внутри много графиков и некоторые рассуждения.
И вот ещё краткое объяснение.
GD Star Rating
loading...
loading...
Вводя различные слова на период между 1920 и 2008 годами, я заметил, что в большинстве случаев на 1970 год приходится минимум частотности. Стало любопытно: а есть ли такие слова, которые встречаются в литературе того времени особенно часто? И вот что получилось.
Вот серия графиков, посвящённых различным общечеловеческим и философским вопросам:
Извиняюсь за мелкость подписей, но ничего не могу поделать.
Как можно заметить, эти понятия относительно редко встречаются в литературе того времени. А вот цикл понятий, касающихся техники:
Обратите внимание: с 1960 года до 1998 график монотонно возрастает.
Дада, давайте больше интересных графиков.
Крайне популярный термин советского времен. Означает искусственную конкуренцию производителей в плановой экономике. Резко возрастает с конца шестидесятых и затем резко убывает с начала восьмидесятых.
Термин «машина» вытесняется термином «механизм», потому что первый всё больше означает «автомобиль», что хорошо заметно с конца девяностых.
На основании этих графиков можно сделать следующее резюме. Дискуссия между «физиками» и «лириками», начавшись после смерти Сталина закончилась к середине шестидесятых полной победой «физиков». Люди того времени, скорее всего, довольно мало думали о разных абстрактных гуманистических вопросах, и довольно много концентрировались на работе. Особенно в этом смысле примечателен график «деньги». С середины восьмидесятых тенденция резко меняет направление.
Спасибо за внимание.
фиксировалась вся парадигма? Т.е. вычислительный в т.ч.?
насколько я понимаю, нет. Это можно легко проверить, вбив несколько запросов.
почему искусственную?
более того, сервис не знает букву ё, различает дореволюционное и советское написание слов и т. д.
ЭВМ vs Компьютер 🙂
потому что в плановой экономике нет естественной конкуренции.
Странно.
она вполне есть, просто она не за прибылью, а за исполнением плана.
Это не конкуренция. С Госпланом, что ли, конкурировать?
а вот ещё страннее.
: конкуренция — это буквально и есть «соревнование», «борьба» в переводе с некоторых европейских языков. В плановой экономике естественного соревнования нет, поэтому создаётся искусственное, так называемое «социалистическое».
Чипы на дизельной тяге! У этого слова есть какоето ещё значение в русском языке, интересно?
раз
два
Ты не понял, я спрашивал про «чип».
В смысле есть ли у него омоним? Я такого припомнить не могу.
есть, «чипой» называется лёд. Соответственно, слово «чипа» он может индексировать как родительный падеж от «чип».
насколько я понял, сервис отслеживает только буквальные употребления.
Вообще, было бы чертовски мило, если бы ктонибудь нарыл побольше информации о работе сервиса, разжевал и нам бы всем объяснил.
Не оно разве?
нет, к сожалению.
//www.google.com/search?q=%22%D1%87 :1,1,1800,1816&lr=l ang_ru
там каждое употребление можно найти в конкретной книге, ссылки внизу 18001820
Дружище, большое тебе спасибо, ты очень отзывчивый человек! Но я имел ввиду не просто наличие этого слова в русском языке, а частоту его употребления до 50х годов 20 века.
а ты посмотри в книгах сплошь ошибки распознавания, в лучшем случае сокращения. То есть доверять этому сервису стоит с большой осторожностью.
this ^
Да, я примерно так и подумал, и в своём info они стыдливо пишут: «but some errors do slip through«. Кроме того, применение smothing, особенно более 78 както странно отражается на результатах. Жаль, но тогда и весь пост подлежит сомнению
И вот ещё вопрос, на который в info даётся очень расплывчатый ответ: насколько репрезентативна выборка, каким количеством книг, особенно начала века, пользуется сервис? Просто, особенно учитывая «проскользнувшие ошибки», если число публикаций в анализе чтото около пары десятков, кривая может делать самые невероятные кульбиты на ранних этапах.
this ?
ошибка распознавания в тренде константа, так что её легко можно вычитать из графика, и это в худшем случае. Обычно она просто не попадает в 9095%.
да, а о размере выборки можно судить по ступенчатости графика 😉
Нуу?! А ты поэкспериментируй с терминами, с аппроксимацией, с синонимами. И, кстати, это точно, что ошибка распознавания константа? Прям в одном датацентре делали, в одно время, одним и тем же сертифицированным инструментарием? И источники все одинакового качества были, да? Это всётаки риалуорлд, а не модель.
Во! Вот меня и удивили результаты с разной аппроксимацией.
я там посмотрел, если внизу нажать на примеры в диапазоне годов, то вываливается очень много книг.
Спасибо. Мне всё стало понятно. И нифига ошибки чтения не константа, с учётом того, что а). алгоритмы распознавания создавались для современного языка и б). качество полиграфии в прошлом, и степень сохранности документов сильно отличаются от современных.
с нетерпением жду революцию в гуманитарных науках, особенно в истории.
Хм. На основе данного сервиса?
вот здесь пишут, что это отличное начало внедрения естественно научных подходов в гуманитарные науки. Помоему, разумно.
Да, и конечно, слово «шуба» хорошо вписывается в общую парадигму.
Я бы назвал это явление «эффектом шубы».
Вот ещё словочисло.
интересно. Во время ВМВ чаще использоволась «ложь» нежели «истина».
Объясните ситуацию, плиз. Почему в 2006м взлетел интерес к ложкам, а затем к ножам?
ложки вышли на страницы всякой эзотерики и народной медицины. Ножи кроме того чаще стали упоминаться в детективах и псевдоисторической лабуде.
Я думаю, это связано в первую очередь с тем, что гугловцы вряд ли отсканировали много подобной литературы прошлых лет. Её нормальный человек не хранит, да и смысл сканировать ерунду всякую?
Отсюда можно сделать такой ещё вывод. Интерес ко всякой гуманитарщине несомненно до шестидесятых выше чем после шестидесятых. Но вот не следует ли связывать повышение цитируемости гуманитарщины в последнее время с тем, что она просто недолговечнее технарщины, и поэтому (тут мне лень писать, легко додумать самому).
Я гоняю уже несколько дней, тоже с интересными пиками.
Вопервых, почти у всех слов есть резкие пики на мировых войнах.
Вовторых, самая смешная пара drugs,flowers. Попробуйте сами!
да, это чума 🙂
Тоесть хиппито и не знали?!
Совершенно безумный фалический символ. А с чем может быть связано такой резкий рост упоминаний? Странно если про японского императора руководителя империалистической Японии.
пропагандистская литература, бомбы, последующее отречение.
ну отрекаться то он не стал всё таки.
Да и странно что один только японский император делает такую огромную работу.
Да это не он делает, а советские публицисты и журналисты.
ты слово на русском ввел, и анализировались русскоязычные источники. Потом, 0.003% не так чтобы жуткая частота.
Кстати, примерно в то же время, кажется, и китайский император двинул в Союз на посидеть.
гугл показывает, что в те времена было опубликовано огромное количество исторических работ. «Император» там на каждой странице.
используя этот сайт, например, вы всегда могли бы радовать нас картинками, которые смогли бы разглядеть наши близорукие глаза.
ура! Спасибо!
проверка
CASESENSITIVE
водка, пиво, сок, самогон
героин, кокаин, анаша, опиум
сказка,быль
всё сиюминутно, кроме водки.