|
От
|
tarasv
|
|
К
|
sas
|
|
Дата
|
23.08.2023 19:18:01
|
|
Рубрики
|
Современность;
|
|
Re: Спасибо большое.
>В этом случае получается, что данное распределение вряд ли можно использовать для экстраполяции общего объема базы Лостармор.
Да, оно явно перекошенное.
>Дело в том, что в ней количество записей на Б и на А соотносятся между собой примерно как 3,6 : 1. Т.е. для приведенного Вами распределения, если я не ошибся, это соответствовало бы примерно 2,13 %. т.е. месту между Л и Д.
Скорее всего там и будет. К сожалению делать произвольные запросы к базе сайта нельзя. Я нашел способ получить 10 фамилий на произвольную букву. Какая сортировка не очень понятно. Для А у меня получилось 8 фамилий число носителей которых выглядит как из второй сотни самых распространенных. С ними получается
К 21.3%
М 11.4%
П 11%
Б 7.6%
Т 7.1%
Ш 6.2%
С 5.2%
Г 4.1%
Р 3.5%
В 3.5%
І 3.2%
Л 3.1%
А 2.4%
Д 2%
Х 1.9%
О 1.8%
Н 1.5%
Я 1.4%
Ю 0.9%
Ф 0.8%
З 0.7%
Ж 0.7%
Орфографический словарь читал - не помогает :)