От Фигурант
К All
Дата 06.01.2011 04:47:13
Рубрики Прочее; Современность;

Явление гениального (контр-)срачинструмента: Ngram от Гугла.

Если кто-то хочет узнать почему так называется:
http://en.wikipedia.org/wiki/N-gram
Короче, филиал ЗОГ Гугл Labs капитализировал на многолетнем сканировании и анализе мировой литературы (на нескольких языках, в.т.ч. и на русском) и представляет среднестатическому юзеру инструмент, который был до сих пор зарезервирован за кастой университетских кадров, которые имели доступ к спецбазам лингвистических данных. Понятно что статистически (особенно на русском языке) Нграм еще далек до совершенства и до специализированных инструментов, и в английском варианте не дотягивает (еще) до англоязычных ресурсов университетского уровня (особенно что касается точного лингвистического анализа), но для историков у которых как всегда время в обрез это уже очень и очень неплохо.

Грубо говоря, система по запросу отдельного слова или целого выражения/фразы/предиката сканирует уйму публикаций примерно от 1800 г. до наших дней и выводит на график эволюцию их употребления. Поиск можно потом уточнить, посмотреть источники итд. (все пока еще не на самом высоком уровне, но можно себе представить что это будет означать для среднестатического хотя бы студента).

Т.е. если кто-то сомневается что выражение "холодная война" появилось ранее 1945 года, сразу наглядно выводится опровержение :)

Осторожно: система поиска "case sensitive", так что запрос "путин" и "Путин" выдаст совершенно отличные результаты :))

Дело конечно не ограничивается В и И топичностью - некоторые запросы типа "космонавтика", "лазер" или "благо народа" тоже наводят на непростые мысли... А уж всякие "пролетарии всех стран...", "генетика" или "ЭВМ" - очень показательны. Отдельный отвал башки гарантирует сопоставление графов частоты "Отечество" vs "Родина". "Империализм" и особенно "империалисты"или тоже много поясняет.

Это все просто наводки - ВИ составляющая и так ясная, думаю :)))

Девайс:
http://ngrams.googlelabs.com/

От digger
К Фигурант (06.01.2011 04:47:13)
Дата 07.01.2011 06:11:34

Тенденция

Есть слова,которые демонстрируют почти экспоненциальный рост : 2 нетрадиционных вида секса (English),genocide,говно.Слово,которое показывает экспоненциальный спад - love.

От digger
К digger (07.01.2011 06:11:34)
Дата 07.01.2011 06:15:25

"Брежнев"

"Брежнев" - красивый такой зуб как у генератора пилообразных колебаний.

От Hokum
К Фигурант (06.01.2011 04:47:13)
Дата 07.01.2011 05:01:45

И встроенный антимат-фильтр

Хотел проверить, когда же появилось на Руси знаменитое монголо-китайское слово из трех букв. Облом-с. Прямо как в анекдоте - ... есть, а слова нет :)

От Деревянкин
К Hokum (07.01.2011 05:01:45)
Дата 07.01.2011 17:24:03

у меня ищется (-)


От Сергей Зыков
К Hokum (07.01.2011 05:01:45)
Дата 07.01.2011 06:15:21

А разве не от Кия?

>Хотел проверить, когда же появилось на Руси знаменитое монголо-китайское слово из трех букв. Облом-с. Прямо как в анекдоте - ... есть, а слова нет :)

Кий — легендарный князь полян, основатель Киева. Согласно легенде, приведённой автором «Повести временных лет», Кий, живший на днепровских горах вместе со своими младшими братьями Щеком, Хоривом и сестрой Лыбедь…

вертикаль власти такскать



От digger
К Hokum (07.01.2011 05:01:45)
Дата 07.01.2011 06:02:35

Re: слово из трех букв

Есть, там в комбо надо выбрать русский.И на иврите есть.

От Stalker
К digger (07.01.2011 06:02:35)
Дата 07.01.2011 13:51:53

Ре: слово из...

Здравствуйте
> .И на иврите есть.

на иврите это слово поменяло смысл за последние 50 лет. В оригинале - "вооружение".
С уважением

От digger
К Stalker (07.01.2011 13:51:53)
Дата 07.01.2011 18:38:47

Ре: слово из...

И еще из идиша.Зона и ее бен значения не поменяли,но тоже в изобилии, из Талмуда.

От SadStar3
К Фигурант (06.01.2011 04:47:13)
Дата 07.01.2011 04:07:29

99% применения будет как "аргументы" для мегасрача т.к.

Что бы правильно понимать статистику нужно очень много знать

От vladvitkam
К Фигурант (06.01.2011 04:47:13)
Дата 06.01.2011 20:03:51

раскулачиавание

в наше время разговоров о нем в разы больше, чем во время проведения

От Валера
К vladvitkam (06.01.2011 20:03:51)
Дата 06.01.2011 21:58:29

Re: раскулачиавание

>в наше время разговоров о нем в разы больше, чем во время проведения

Оно тогда по другому называлось.

От Evg
К Фигурант (06.01.2011 04:47:13)
Дата 06.01.2011 19:23:44

Re: Интересно, а против кого?


>Т.е. если кто-то сомневается что выражение "холодная война" появилось ранее 1945 года, сразу наглядно выводится опровержение :)

Кто против кого холодно воевал (собирался) в районе 1900г. ???

От Сергей Зыков
К Evg (06.01.2011 19:23:44)
Дата 08.01.2011 04:25:40

термин придумывают намного позже самого явления, да и меняется он зачастую

если конечно это явление действительно оное а не хорошо приготовленный "экспромт" с роялем в кустах и танцевальной группой из случайных прохожих

>Кто против кого холодно воевал (собирался) в районе 1900г. ???

Холодную войну у нас в 20-е придумали(судя по выбуху в том месте) а капиталисты только в 40-х если сравнивать по двуязычным схемам.

[135K]



От Фигурант
К Evg (06.01.2011 19:23:44)
Дата 07.01.2011 21:46:41

Термин "холодная война" не ограничен периодом пост-ВОВ ;) (-)


От Evg
К Фигурант (07.01.2011 21:46:41)
Дата 07.01.2011 22:44:32

Re: Это не оспаривается (-)


От JGL
К Evg (06.01.2011 19:23:44)
Дата 06.01.2011 20:50:39

Re: Интересно, а...

Здравствуйте,

>>Т.е. если кто-то сомневается что выражение "холодная война" появилось ранее 1945 года, сразу наглядно выводится опровержение :)
>
>Кто против кого холодно воевал (собирался) в районе 1900г. ???
Там какой-то отчёт о 21-м съезде Славы Кпсс 1898-м годом датируется ;)

С уважением, Юрий.

От ZULU
К Фигурант (06.01.2011 04:47:13)
Дата 06.01.2011 19:14:26

Странно - совсем не кажет Афро-Американс vs негро и ниггер :( (-)


От VadimV1144
К ZULU (06.01.2011 19:14:26)
Дата 06.01.2011 21:11:02

Re: Странно -...

Кожет, все кажет:

http://ngrams.googlelabs.com/graph?content=negro%2Cnigger%2CAfrican+American&year_start=1800&year_end=2000&corpus=0&smoothing=3

От ZULU
К VadimV1144 (06.01.2011 21:11:02)
Дата 06.01.2011 21:45:36

Теперь и мне показали. Но до это "афроамериканская" линия ровно на нуле была (-)


От Ktulu
К ZULU (06.01.2011 19:14:26)
Дата 06.01.2011 20:31:16

ПК-цензура не пропустила (-)


От vladvitkam
К Фигурант (06.01.2011 04:47:13)
Дата 06.01.2011 19:08:16

Re: не понял: слова "декавилька" нет вообще :( (-)


От vladvitkam
К vladvitkam (06.01.2011 19:08:16)
Дата 06.01.2011 19:09:33

Re: а вот слово "узкоколейка" +

дает острый всплеск на рубеже 1920-30-х

От vladvitkam
К vladvitkam (06.01.2011 19:09:33)
Дата 06.01.2011 19:27:55

Re: интерсно-то как

http://ngrams.googlelabs.com/graph?content=%D0%B1%D0%B0%D1%80%D0%B1%D0%B5%D1%82&year_start=1800&year_end=2000&corpus=12&smoothing=3

http://ngrams.googlelabs.com/graph?content=%D0%B1%D0%B0%D1%80%D0%B1%D0%B0%D0%BA%D0%B0%D0%BD&year_start=1800&year_end=2000&corpus=12&smoothing=3

http://ngrams.googlelabs.com/graph?content=%D1%81%D0%BA%D0%B2%D0%BE%D0%B7%D0%BD%D0%B8%D0%BA&year_start=1800&year_end=2000&corpus=12&smoothing=3

http://ngrams.googlelabs.com/graph?content=%D0%BF%D1%80%D0%BE%D1%82%D0%B8%D0%B2%D0%BE%D0%BE%D1%82%D0%BA%D0%BE%D0%BB%D1%8C%D0%BD%D0%B0%D1%8F+%D0%BE%D0%B4%D0%B5%D0%B6%D0%B4%D0%B0&year_start=1800&year_end=2000&corpus=12&smoothing=3

http://ngrams.googlelabs.com/graph?content=%D0%B4%D0%B2%D1%83%D1%82%D0%B0%D0%B2%D1%80&year_start=1800&year_end=2000&corpus=12&smoothing=3

http://ngrams.googlelabs.com/graph?content=%D1%80%D0%B5%D0%BB%D1%8C%D1%81&year_start=1800&year_end=2000&corpus=12&smoothing=3

http://ngrams.googlelabs.com/graph?content=%D1%80%D0%B5%D0%BB%D1%8C%D1%81%D0%B0&year_start=1800&year_end=2000&corpus=12&smoothing=3

http://ngrams.googlelabs.com/graph?content=%D1%8D%D0%BA%D0%B2%D0%B0%D0%BB%D0%B0%D0%B9%D0%B7%D0%B5%D1%80&year_start=1800&year_end=2000&corpus=12&smoothing=3

http://ngrams.googlelabs.com/graph?content=%D1%8D%D0%BA%D0%BE%D0%BD%D0%BE%D0%BC%D0%B0%D0%B9%D0%B7%D0%B5%D1%80&year_start=1800&year_end=2000&corpus=12&smoothing=3

http://ngrams.googlelabs.com/graph?content=%D0%BA%D0%B0%D0%BF%D0%BE%D0%BD%D0%B8%D1%80&year_start=1800&year_end=2000&corpus=12&smoothing=3

http://ngrams.googlelabs.com/graph?content=%D0%BF%D0%BE%D0%BB%D1%83%D0%BA%D0%B0%D0%BF%D0%BE%D0%BD%D0%B8%D1%80&year_start=1800&year_end=2000&corpus=12&smoothing=3

http://ngrams.googlelabs.com/graph?content=%D0%B1%D0%B8%D0%BC%D0%B1%D0%B5%D1%80&year_start=1800&year_end=2000&corpus=12&smoothing=3

http://ngrams.googlelabs.com/graph?content=%D1%81%D0%B0%D0%BC%D0%BE%D0%B3%D0%BE%D0%BD&year_start=1800&year_end=2000&corpus=12&smoothing=3

http://ngrams.googlelabs.com/graph?content=%D0%B1%D0%BE%D1%80%D0%BC%D0%BE%D1%82%D1%83%D1%85%D0%B0&year_start=1800&year_end=2000&corpus=12&smoothing=3



От tramp
К vladvitkam (06.01.2011 19:27:55)
Дата 07.01.2011 01:07:43

Re: интерсно-то как

ага
http://ngrams.googlelabs.com/graph?content=%D0%B1%D0%B5%D1%80%D0%B5%D0%B3%D0%BE%D0%B2%D0%B0%D1%8F+%D0%BE%D0%B1%D0%BE%D1%80%D0%BE%D0%BD%D0%B0&year_start=1800&year_end=2000&corpus=12&smoothing=3

с уважением

От МУРЛО
К Фигурант (06.01.2011 04:47:13)
Дата 06.01.2011 18:31:24

театр,кино,телевидение,книга (-)


От vladvitkam
К МУРЛО (06.01.2011 18:31:24)
Дата 06.01.2011 19:39:06

Re: газета, журнал (-)


От Василий(ABAPer)
К Фигурант (06.01.2011 04:47:13)
Дата 06.01.2011 18:05:49

Re: Явление гениального...

Мое почтение.

А вот сравнение
котангенс,функция Бесселя,гипергеометрическая функция

показывает падение интереса к более-менее точным наукам.
Добавление косинуса вселяет некоторый оптимизм.

Всего доброго.
С уважением.
Василий (ABAPer)

От vladvitkam
К Василий(ABAPer) (06.01.2011 18:05:49)
Дата 06.01.2011 20:20:53

Re: численные методы (-)


От Валера
К Фигурант (06.01.2011 04:47:13)
Дата 06.01.2011 17:36:31

Re: Явление гениального...

А вот если в русском забить "по сравнению с 1913", то пик приходится на 1960 год. То есть через 47 лет по его прошествии самый пик на сравнение с ним.

http://ngrams.googlelabs.com/graph?content=%D0%BF%D0%BE+%D1%81%D1%80%D0%B0%D0%B2%D0%BD%D0%B5%D0%BD%D0%B8%D1%8E+%D1%81+1913&year_start=1800&year_end=2008&corpus=12&smoothing=3

От Пехота
К Фигурант (06.01.2011 04:47:13)
Дата 06.01.2011 14:47:55

А где в 1845 г. Упоминаются Ленинград и Сталинград? (-)


От Фигурант
К Пехота (06.01.2011 14:47:55)
Дата 06.01.2011 15:03:04

Это результат ошибки датабейз. Изд. Союзписателей СССР датировкой 1870 г. :)

http://www.google.com/search?q=%22Stalingrad%22&tbs=bks:1,cdr:1,cd_min:1870,cd_max:1870&lr=lang_en

От Пехота
К Фигурант (06.01.2011 15:03:04)
Дата 06.01.2011 15:09:13

А джип в 1835-м тоже оттуда? (-)


От Kirindas
К Пехота (06.01.2011 15:09:13)
Дата 08.01.2011 12:03:06

Re: А джип...

beеp beep i'm jeep это не автомобиль

От Фигурант
К Пехота (06.01.2011 15:09:13)
Дата 06.01.2011 15:23:47

Jeep бывает и фамилией :) Аффинируйте временные рамки и см. результаты.

Погрешности всегда бывают, есс-но.

От Андрей Платонов
К Фигурант (06.01.2011 15:23:47)
Дата 06.01.2011 15:38:52

Первое умпоминание слова "танчики" - 1855-1860 гг, ;-) (-)


От Фигурант
К Андрей Платонов (06.01.2011 15:38:52)
Дата 06.01.2011 15:53:22

Нее :(( Там кто-то пропустил Ш в каШтанчики... А потом бра-танчики, шай-танчики. (-)


От Пехота
К Пехота (06.01.2011 15:09:13)
Дата 06.01.2011 15:10:02

А лазер в 1870-м? (-)


От Фигурант
К Пехота (06.01.2011 15:10:02)
Дата 06.01.2011 15:27:43

Один раз ошибка датировки дока, 2-й - речь о "Бертон-Лазере" (н.п.)

В таких случаях стоить установить точные временные рамки по такой странности и смотреть источник сингулярности :)

От Андрей Платонов
К Пехота (06.01.2011 15:10:02)
Дата 06.01.2011 15:19:17

А робот в 1830-м? (-)


От Фигурант
К Андрей Платонов (06.01.2011 15:19:17)
Дата 06.01.2011 15:30:46

А тут ничего странного: сербская летопись, очипятка, малоросские песни и что-то

на еврейском которое комп понял как робот (no pun intended :))) ).


От Андрей Платонов
К Фигурант (06.01.2011 15:30:46)
Дата 06.01.2011 15:35:39

А диод в 1840, 1865, 1895 и 1920-1925 гг? Опять обпечатки в источниках? (-)


От Геннадий Нечаев
К Андрей Платонов (06.01.2011 15:35:39)
Дата 07.01.2011 02:04:12

Re: А что страшного в диоде образца1920-1925 гг? Триод в 1903 запатентован (-)


От Фигурант
К Андрей Платонов (06.01.2011 15:35:39)
Дата 06.01.2011 15:51:32

Хосподи, я что у вас, бета-тестер? :)) Ну посмотрите же: тут ошибка сканирования

латинский quod сканировался как русский диод :))) (это о 1840 и 1865). Дальше лень была смотреть. Всегда какие-то ошибки бывают, поэтому там есть и инструменты контроля :)

От vladvitkam
К Фигурант (06.01.2011 15:51:32)
Дата 06.01.2011 20:07:25

Re: где там просмотр источников? (-)


От Андрей Платонов
К Фигурант (06.01.2011 04:47:13)
Дата 06.01.2011 14:04:22

Забавно

Забил свою фамилию и получил интересный результат: выход из следовых концентраций году эдак в 1916-м, плавный рост, затем резкий всплеск во время войны с резким спадом после ее окончания и потом опять плавный рост. С чего бы - из-за попадания в документы однофамильцев-в/с?..

От Varvar
К Фигурант (06.01.2011 04:47:13)
Дата 06.01.2011 13:44:05

у слова "Сиськи" тоже забавный график (-)


От Андрей Платонов
К Varvar (06.01.2011 13:44:05)
Дата 06.01.2011 14:10:38

У слрова "атом" забавнее:

пик в 30-х, второй - после войны и четкий провал в 60-х... :-)

От Валера
К Фигурант (06.01.2011 04:47:13)
Дата 06.01.2011 09:33:38

Re: Явление гениального...

Да, штука интересная. Сравните график на слова Сталин Ленин и Тройкий

От ДС
К Валера (06.01.2011 09:33:38)
Дата 06.01.2011 13:18:03

Re: Явление гениального...

>Да, штука интересная. Сравните график на слова Сталин Ленин и Тройкий
Действительно интересно! Сравните Капицу с Сахаровым или Шолохова с Солженицыным.
С уважением

От Митрофанище
К ДС (06.01.2011 13:18:03)
Дата 06.01.2011 13:24:34

Re: Явление гениального...

>>Да, штука интересная. Сравните график на слова Сталин Ленин и Тройкий
>Действительно интересно! Сравните Капицу с Сахаровым или Шолохова с Солженицыным.
>С уважением

Сахаровых много

От Валера
К Фигурант (06.01.2011 04:47:13)
Дата 06.01.2011 08:14:51

Re: Явление гениального...

Спасибо, интнесно и полезно действительно. Поискал для пимера Dreadnought - вывалило кучу книг, а графие выдал пие на 1920 год