От Малыш
К Игорь Куртуков
Дата 21.07.2004 10:37:10
Рубрики WWII;

Ре: Определенные -...

>Нет, с формальной точки зрения прав как раз Константин, его аргументация вполне основательна. Что касается слов "математически безграмотно", то они в этом контексте мне совершенно непонятны.

Извините, но не могу с Вами согласиться в части оценки аргументации Константина. В данном случае возможны два корректных подхода. Первый: в Московской стратегической наступательной операции участвовали войска четырех фронтов, потери БТТ такого-то составили 419 единиц, потери трех других не определены. Результат неполон, и его неполнота явно оговорена. Второй: потери БТТ в Московской стратегической наступательной операции составили 0.4 тыс. единиц БТТ, при этом по умолчанию предполагается, что порядок погрешностиь составляет сотни единиц (по последней значащей цифре). Утверждение же, что войска четырех поименно указанных фронтов потеряли 429 единиц БТТ равно и безграмотно, и некорректно.

>Пример из области измерения физических величин тут не годится.

Данный пример вполне пригоден в той части, что указание результатов с точностью до единиц при отсутствии трех значений из четырех и невозможности априори отвергнуть гипотезу о ничтожно малом числе единиц БТТ, потерянных тремя другими фронтами - некорректно.

>Опять таки методология переносится из естественных наук. А вы попробуйте пример из области информационных технологий - есть у вас табличка в базе данных. В каждой строчке значение некоторой величины с точностью до единиц. Однако в некоторых строчках стоит NULL (т.е. данные неизвестны). С какой точностью вам известна сумма по табличке? Правильный ответ - с точностью до единиц. Потому что суума известных значений имеет именно такую точность. А неизвестные - они и есть неизвестные.

Видите ли, с подобными приведенному Вами примерами мне приходится ежедневно сталкиваться по долгу службы. И вся получающаяся в результате подобных действий итоговая статистика всегда сопровождается указанием - по данным какой доли измерений она получена. Я Вам больше того скажу - нами была отвергнута предложенная вендором система статистической обработки, которая позволяла получать "сумму", но при этом не позволяла получать данные о доле NULL-записей.

От Игорь Куртуков
К Малыш (21.07.2004 10:37:10)
Дата 21.07.2004 18:25:48

Ре: Определенные -...

> В данном случае возможны два корректных подхода.

На самом деле только один - вот этот:

> Первый: в Московской стратегической наступательной операции участвовали войска четырех фронтов, потери БТТ такого-то составили 419 единиц, потери трех других не определены. Результат неполон, и его неполнота явно оговорена.

И только так. Часто в таких случаях употребляют выражение "по неполным данным". Еще лучше было бы привести данные по потерям на каждый фронт раздельно, чтобы было видно где именно данные неполны.

> Второй: потери БТТ в Московской стратегической наступательной операции составили 0.4 тыс. единиц БТТ, при этом по умолчанию предполагается, что порядок погрешностиь составляет сотни единиц

Этот подход абсолютно некорректен. Понятие "погрешности" неправомерно переносится из другой области знаний. В данном примере нет вобще никакой погрешности, есть неполнота данных.

Эту неполноту можно попытаться восполнить ОЦЕНКОЙ, тогда у нас будут не учетные данные, а оценочные. Тут уже можно говорить о погрeшности оценки.

>Данный пример вполне пригоден в той части, что указание результатов с точностью до единиц при отсутствии трех значений из четырех

Это единственно возможный вариант. Точность именно до единиц. Просто данные неполны.

>Видите ли, с подобными приведенному Вами примерами мне приходится ежедневно сталкиваться по долгу службы.

Я догадывался :-)

От Константин Федченко
К Малыш (21.07.2004 10:37:10)
Дата 21.07.2004 12:46:04

Ре: Определенные -...

>Второй: потери БТТ в Московской стратегической наступательной операции составили 0.4 тыс. единиц БТТ, при этом по умолчанию предполагается, что порядок погрешность составляет сотни единиц (по последней значащей цифре).

Но ведь это некорректно. Без дополнительных данных о характере потерь в трех остальных фронтах просто невозможно делать предположения о том, что порядок погрешности составляет сотни единиц!
Пример А:
во фронте, данные по которому есть, имелось 500 танков, потери 429.
в трех остальных имелось по 10 танков, потери 100% (итого 30).
общие потери - 459.
порядок погрешности - десятки.
Пример Б:
во фронте, данные по которому есть, имелось 500 танков, потери 429.
в трех остальных имелось по 1000 танков, потери 80% (итого 2400).
Общие потери - 2829.
порядок погрешности - тысячи.

>И вся получающаяся в результате подобных действий итоговая статистика всегда сопровождается указанием - по данным какой доли измерений она получена.

Согласен, строго говоря - авторам следовало указать, что потери даны по данным одного из четырех фронтов, т.е. неполны.
Более того - согласен, что уровень квалификации в области статистики и информационных технологий, показанный коллективом авторов, оказался недостаточно высок.
Тем не менее! авторы четко оговорили в предисловии к работе, что приведенные данные полными и окончательными не являются, а вот подход с округлением известных данных (до неизвестного даже по порядку величины уровня погрешности) представляется категорически неверным и ненаучным.

>Я Вам больше того скажу - нами была отвергнута предложенная вендором система статистической обработки, которая позволяла получать "сумму", но при этом не позволяла получать данные о доле NULL-записей.

Видите ли, даже данные о доле NULL-записей могут нести ноль полезной информации. Все зависит от описываемой системы данных.

С уважением

От Малыш
К Константин Федченко (21.07.2004 12:46:04)
Дата 21.07.2004 13:13:11

Ре: Определенные -...

>Но ведь это некорректно.

Некорректно. Но более корректно, чем приводить цифру с точностью до единиц при отсутствии трех величин из четырех.

>Без дополнительных данных о характере потерь в трех остальных фронтах просто невозможно делать предположения о том, что порядок погрешности составляет сотни единиц!

Тогда остается единственный корректный вариант - первый. Но тогда надо написать, что в потерях 1941 года учтены потери танков, которые почему-то не учтены при подсчете ресурса. Что в "ресурс" не включены 540 танков "других типов". И т. д. и т. п.

>Тем не менее! авторы четко оговорили в предисловии к работе, что приведенные данные полными и окончательными не являются, а вот подход с округлением известных данных (до неизвестного даже по порядку величины уровня погрешности) представляется категорически неверным и ненаучным.

Видите ли, Константин, если встать на предлагаемую Вами точку зрения, то цена работы Кривошеева снижается до нуля. Потому что можно, например, указать: "Общая численность безвозвратных потерь РККА в ВОВ составила 8 (восемь) человек - данные неполные и окончательными не являются". И степень достоверности этих двух утверждений будет абсолютно одинакова.
Но коль скоро Кривошеев претендует на оценку, то volens-nolens должен учитывать "поправки на неизвестное". Единственный способ корректно учесть эти поправки - не приводить точность "до единицы БТТ" там, где число сотен и тысяч единиц БТТ оказывается под вопросом. То есть не придавать своей работе излишний флер научности :) . Либо - если он придан - отвечать за художества, вроде мною указанных.