От apple16 Ответить на сообщение
К All Ответить по почте
Дата 27.04.2019 22:53:32 Найти в дереве
Рубрики Прочее; Современность; Версия для печати

Занимательная демография

Для быстрого поиска данных по архивам иногда полезно знать как часто встречаются разные имена. В природе существует некий список ФИО сотрудников одной организации примерно на 400 тысяч записей. (там нет персональных данных - просто имена)
Я запулил поиск на предмет какие имена сейчас в России самые популярные среди работающих людей. (выборка та большая - пол процента как никак)

Результаты:

Имен с частотой вхождения более 100 всего 61
Топ 10 выглядят примерно так

александр 10935
сергей 9109
алексей 7272
дмитрий 7100
андрей 6673
евгений 4445
владимир 3868
михаил 3177
максим 3041
игорь 2602


Доля нетрадиционных имен - примерно 10%
(вадим, эдуард, тимур, марат и тп)

Разных более редких имен (от 20 до 100 вхождений) уже 72 и там доля нетрадиционных растет, но все они в сумме дают меньше людей чем одно имя Владимир.

Хвост прочих имен идет на тысячи, но там лень разбираться ибо вместе там людей тысяч 10, и из них женщин процентов 70.
(отличать мужчин от женщин пришлось вручную, имен типа Раушан, где оба пола бывают не так и много к счастью)

Неожиданно кстати выяснилось, что, не смотря на все вопли о жутком засилии национальных меньшинств, работающее население РФ довольно монолитно и носит в массе своей традиционные имена

Список с циферками
https://vif2ne.org/nvk/forum/files/Apple16/(190427214407)_names.txt

PS Самые популярные женские имена, что тоже полезно для поиска в ОБД
(случай с зенитчицами)

елена 20895
ольга 17115
наталья 16196
татьяна 15695
ирина 14044
юлия 13875
екатерина 13660
светлана 11595
анна 11248
анастасия 10573


PPS я не заморачивался буквой ё, разными вариантами одного имени (Наталия, Наталья), чисткой списка от левых слов

Следующий шаг - дернуть список людей из ОБД "Память народа" и сравнить цифры