От Константин Федченко
К Малыш
Дата 20.07.2004 14:58:46
Рубрики WWII;

Re: Определенные -...

>>Видите ли, еще в предисловии авторы указали, что в книге есть недостаточно полные сведения, и указали, в каких случаях и по каким причинам такая неполнота обычно возникала.
>
>И снова не могу с Вами согласиться. Например, графа табл. 186 Кривошеева "Наличие, поступление и потери вооружения и техники (по годам войны)" (
http://www.rus-sky.org/history/library/w/w091.htm#_Toc2489828 )

простите, но в указанной Вами таблице я не нашел ни точности более сотни танков, ни какой-либо их классификации по типам, кроме (тяжелый/легкий/средний). Причем ни в печатном варианте, ни в двух электронных вариантах.


>- для танков Т-28 заделана строка,
>в графе "Потери" оные танки наличествуют в количестве 370 штук;
>- наличествует строка таблицы "Прочие танки" в количестве 540 штук

равно как не нашел и этих граф и строк

>Что при учете потерь БТТ одного фронта из четырех участвовавших в операции точность до единиц машин выглядит издевательством?

а это см. https://vif2ne.org/nvk/forum/2/co/831908.htm - другого способа указать точность просто нет. Предложите свой вариант, если хотите.
С уважением

От Игорь Куртуков
К Константин Федченко (20.07.2004 14:58:46)
Дата 20.07.2004 18:41:42

Ре: Определенные -...

>простите, но в указанной Вами таблице я не нашел ни точности более сотни танков, ни какой-либо их классификации по типам, кроме (тяжелый/легкий/средний).

Дык даже с такой точностью видно, что научный коллектив в своей табличке в графах тажелые и средние учел только танки новых типов. Тяжелые и средние старых типов (Т-28 и Т-35) в таблицу не вошли.


От Малыш
К Константин Федченко (20.07.2004 14:58:46)
Дата 20.07.2004 15:14:58

Re: Определенные -...

>простите, но в указанной Вами таблице я не нашел ни точности более сотни танков, ни какой-либо их классификации по типам, кроме (тяжелый/легкий/средний). Причем ни в печатном варианте, ни в двух электронных вариантах.

Я говорю о таблице в цитированных мной "Отчетных материалах", совокупные данные коей перешли в таблицу 186. В исходных данных, как я уже указал, нет сведений о Т-35 и Т-28. Сведений о наличии и поступлении Т-28 нет - а вот о списании есть, что сразу сдвигает баланс на 369 единиц за 1941 год. Наличествуют некие "прочие танки", которые не включаются в итоги суммирования. Можно не быть выдающимся специалистом в области истории БТТ, чтобы понять, что ошибка составляет порядка сотен единиц и уж, во всяком случае, превышает последнюю значащую цифру (Кривошеев дает данные с точностью до десятых долей тысячи, то есть сотни).

>равно как не нашел и этих граф и строк

Извините, если я неудачно выразился - эти строки наличествуют в "Отчетных материалах".

>а это см.
https://vif2ne.org/nvk/forum/2/co/831908.htm - другого способа указать точность просто нет. Предложите свой вариант, если хотите.

Видите ли, Константин, с формальной точки зрения прав скорее mpolikar, чем Вы - если Вы не можете гарантировать справедливость даже числа тысяч, то указание сотен, десятков и единиц математически безграмотно, длина стола 1501129 микрометров плюс-минус пятьдесят сантиметров :) . Более того, при приближенных вычислениях всюду неявно подразумевается, что результат приводится с точностью до значащих цифр - то есть если указаны потери с точностью до единиц, то и ошибка составляет порядка единиц. Потому для Кривошеева корректным путем был бы, как минимум, отказ от сотен в графах "наличие", "поступление" и "потери" и переход на тысячи с одной значащей цифрой после запятой в потерях по стратегическим операциям - то есть в Московской стратегической наступательной операции потери составили 0.4 тыс. единиц БТТ, при этом подразумевается, что погрешность составляет порядка сотен единиц.

От Игорь Куртуков
К Малыш (20.07.2004 15:14:58)
Дата 20.07.2004 18:54:05

Ре: Определенные -...

>Видите ли, Константин, с формальной точки зрения прав скорее мполикар, чем Вы - если Вы не можете гарантировать справедливость даже числа тысяч, то указание сотен, десятков и единиц математически безграмотно

Нет, с формальной точки зрения прав как раз Константин, его аргументация вполне основательна. Что касается слов "математически безграмотно", то они в этом контексте мне совершенно непонятны.

> длина стола 1501129 микрометров плюс-минус пятьдесят сантиметров :) .

Пример из области измерения физических величин тут не годится.

> неявно подразумевается, что результат приводится с точностью до значащих цифр - то есть если указаны потери с точностью до единиц, то и ошибка составляет порядка единиц.

Опять таки методология переносится из естественных наук. А вы попробуйте пример из области информационных технологий - есть у вас табличка в базе данных. В каждой строчке значение некоторой величины с точностью до единиц. Однако в некоторых строчках стоит NULL (т.е. данные неизвестны). С какой точностью вам известна сумма по табличке? Правильный ответ - с точностью до единиц. Потому что суума известных значений имеет именно такую точность. А неизвестные - они и есть неизвестные.

От Малыш
К Игорь Куртуков (20.07.2004 18:54:05)
Дата 21.07.2004 10:37:10

Ре: Определенные -...

>Нет, с формальной точки зрения прав как раз Константин, его аргументация вполне основательна. Что касается слов "математически безграмотно", то они в этом контексте мне совершенно непонятны.

Извините, но не могу с Вами согласиться в части оценки аргументации Константина. В данном случае возможны два корректных подхода. Первый: в Московской стратегической наступательной операции участвовали войска четырех фронтов, потери БТТ такого-то составили 419 единиц, потери трех других не определены. Результат неполон, и его неполнота явно оговорена. Второй: потери БТТ в Московской стратегической наступательной операции составили 0.4 тыс. единиц БТТ, при этом по умолчанию предполагается, что порядок погрешностиь составляет сотни единиц (по последней значащей цифре). Утверждение же, что войска четырех поименно указанных фронтов потеряли 429 единиц БТТ равно и безграмотно, и некорректно.

>Пример из области измерения физических величин тут не годится.

Данный пример вполне пригоден в той части, что указание результатов с точностью до единиц при отсутствии трех значений из четырех и невозможности априори отвергнуть гипотезу о ничтожно малом числе единиц БТТ, потерянных тремя другими фронтами - некорректно.

>Опять таки методология переносится из естественных наук. А вы попробуйте пример из области информационных технологий - есть у вас табличка в базе данных. В каждой строчке значение некоторой величины с точностью до единиц. Однако в некоторых строчках стоит NULL (т.е. данные неизвестны). С какой точностью вам известна сумма по табличке? Правильный ответ - с точностью до единиц. Потому что суума известных значений имеет именно такую точность. А неизвестные - они и есть неизвестные.

Видите ли, с подобными приведенному Вами примерами мне приходится ежедневно сталкиваться по долгу службы. И вся получающаяся в результате подобных действий итоговая статистика всегда сопровождается указанием - по данным какой доли измерений она получена. Я Вам больше того скажу - нами была отвергнута предложенная вендором система статистической обработки, которая позволяла получать "сумму", но при этом не позволяла получать данные о доле NULL-записей.

От Игорь Куртуков
К Малыш (21.07.2004 10:37:10)
Дата 21.07.2004 18:25:48

Ре: Определенные -...

> В данном случае возможны два корректных подхода.

На самом деле только один - вот этот:

> Первый: в Московской стратегической наступательной операции участвовали войска четырех фронтов, потери БТТ такого-то составили 419 единиц, потери трех других не определены. Результат неполон, и его неполнота явно оговорена.

И только так. Часто в таких случаях употребляют выражение "по неполным данным". Еще лучше было бы привести данные по потерям на каждый фронт раздельно, чтобы было видно где именно данные неполны.

> Второй: потери БТТ в Московской стратегической наступательной операции составили 0.4 тыс. единиц БТТ, при этом по умолчанию предполагается, что порядок погрешностиь составляет сотни единиц

Этот подход абсолютно некорректен. Понятие "погрешности" неправомерно переносится из другой области знаний. В данном примере нет вобще никакой погрешности, есть неполнота данных.

Эту неполноту можно попытаться восполнить ОЦЕНКОЙ, тогда у нас будут не учетные данные, а оценочные. Тут уже можно говорить о погрeшности оценки.

>Данный пример вполне пригоден в той части, что указание результатов с точностью до единиц при отсутствии трех значений из четырех

Это единственно возможный вариант. Точность именно до единиц. Просто данные неполны.

>Видите ли, с подобными приведенному Вами примерами мне приходится ежедневно сталкиваться по долгу службы.

Я догадывался :-)

От Константин Федченко
К Малыш (21.07.2004 10:37:10)
Дата 21.07.2004 12:46:04

Ре: Определенные -...

>Второй: потери БТТ в Московской стратегической наступательной операции составили 0.4 тыс. единиц БТТ, при этом по умолчанию предполагается, что порядок погрешность составляет сотни единиц (по последней значащей цифре).

Но ведь это некорректно. Без дополнительных данных о характере потерь в трех остальных фронтах просто невозможно делать предположения о том, что порядок погрешности составляет сотни единиц!
Пример А:
во фронте, данные по которому есть, имелось 500 танков, потери 429.
в трех остальных имелось по 10 танков, потери 100% (итого 30).
общие потери - 459.
порядок погрешности - десятки.
Пример Б:
во фронте, данные по которому есть, имелось 500 танков, потери 429.
в трех остальных имелось по 1000 танков, потери 80% (итого 2400).
Общие потери - 2829.
порядок погрешности - тысячи.

>И вся получающаяся в результате подобных действий итоговая статистика всегда сопровождается указанием - по данным какой доли измерений она получена.

Согласен, строго говоря - авторам следовало указать, что потери даны по данным одного из четырех фронтов, т.е. неполны.
Более того - согласен, что уровень квалификации в области статистики и информационных технологий, показанный коллективом авторов, оказался недостаточно высок.
Тем не менее! авторы четко оговорили в предисловии к работе, что приведенные данные полными и окончательными не являются, а вот подход с округлением известных данных (до неизвестного даже по порядку величины уровня погрешности) представляется категорически неверным и ненаучным.

>Я Вам больше того скажу - нами была отвергнута предложенная вендором система статистической обработки, которая позволяла получать "сумму", но при этом не позволяла получать данные о доле NULL-записей.

Видите ли, даже данные о доле NULL-записей могут нести ноль полезной информации. Все зависит от описываемой системы данных.

С уважением

От Малыш
К Константин Федченко (21.07.2004 12:46:04)
Дата 21.07.2004 13:13:11

Ре: Определенные -...

>Но ведь это некорректно.

Некорректно. Но более корректно, чем приводить цифру с точностью до единиц при отсутствии трех величин из четырех.

>Без дополнительных данных о характере потерь в трех остальных фронтах просто невозможно делать предположения о том, что порядок погрешности составляет сотни единиц!

Тогда остается единственный корректный вариант - первый. Но тогда надо написать, что в потерях 1941 года учтены потери танков, которые почему-то не учтены при подсчете ресурса. Что в "ресурс" не включены 540 танков "других типов". И т. д. и т. п.

>Тем не менее! авторы четко оговорили в предисловии к работе, что приведенные данные полными и окончательными не являются, а вот подход с округлением известных данных (до неизвестного даже по порядку величины уровня погрешности) представляется категорически неверным и ненаучным.

Видите ли, Константин, если встать на предлагаемую Вами точку зрения, то цена работы Кривошеева снижается до нуля. Потому что можно, например, указать: "Общая численность безвозвратных потерь РККА в ВОВ составила 8 (восемь) человек - данные неполные и окончательными не являются". И степень достоверности этих двух утверждений будет абсолютно одинакова.
Но коль скоро Кривошеев претендует на оценку, то volens-nolens должен учитывать "поправки на неизвестное". Единственный способ корректно учесть эти поправки - не приводить точность "до единицы БТТ" там, где число сотен и тысяч единиц БТТ оказывается под вопросом. То есть не придавать своей работе излишний флер научности :) . Либо - если он придан - отвечать за художества, вроде мною указанных.

От Wizard
К Игорь Куртуков (20.07.2004 18:54:05)
Дата 20.07.2004 21:35:38

Все-таки прав именно Малыш

>>Видите ли, Константин, с формальной точки зрения прав скорее мполикар, чем Вы - если Вы не можете гарантировать справедливость даже числа тысяч, то указание сотен, десятков и единиц математически безграмотно
>
>Нет, с формальной точки зрения прав как раз Константин, его аргументация вполне основательна. Что касается слов "математически безграмотно", то они в этом контексте мне совершенно непонятны.

>> длина стола 1501129 микрометров плюс-минус пятьдесят сантиметров :) .
>
>Пример из области измерения физических величин тут не годится.

Пример как раз абсолютно верный. Если производится измерение некой физической величины (а кол-во танков именно физическая величина) то к этому измерению применимы правила обработки результата в зависимости от метода измерения. И определенным образом (опять же, в зависимости от метода измерения) формируется погрешность измерения.

В данном случае Малыш привел оценку снизу погрешности измерения. Это сотни танков. Таким образом, аккуратный исследователь должен указать результат (кол-во танков) и погрешность. Тогда квалифицированный читатель и не подумает обрашать внимание на разряды результата, меньшие погрешности.
Погрешность не приведена. Поскольку, принципиально, кол-во танков физические законы не запрешают измерить точно и, в общем-то все читатели это интуитивно понимают, то возникает логическая цепочка:
погрешность не указана -> она = 0 -> все цифры достоверны

>> неявно подразумевается, что результат приводится с точностью до значащих цифр - то есть если указаны потери с точностью до единиц, то и ошибка составляет порядка единиц.
>
>Опять таки методология переносится из естественных наук. А вы попробуйте пример из области информационных технологий - есть у вас табличка в базе данных. В каждой строчке значение некоторой величины с точностью до единиц. Однако в некоторых строчках стоит NULL (т.е. данные неизвестны). С какой точностью вам известна сумма по табличке? Правильный ответ - с точностью до единиц. Потому что суума известных значений имеет именно такую точность. А неизвестные - они и есть неизвестные.

Пример неудачный, дело в трактовке данных. Вы трактуете значение NULL, как нехватку информации. В этом случае если есть стат. гипотеза о распределении значений атрибута, то можно вывести погрешность суммы значений атрибутов.
Та же сумма, которую Вы считаете есть сумма только непустых значений атрибута и она Вам известна как раз точно.
Попытка посчитать сумму "в лоб" даст ответ NULL, т.к. сумма вроде 2+3+NULL+4+NULL даст NULL. То есть сумма Вам известна не с точностью до единиц, а вообще неизвестна, раз именно так Вы трактуете NULL.

Извините за придиразм.

С уважением, Wizard

От Игорь Куртуков
К Wizard (20.07.2004 21:35:38)
Дата 20.07.2004 22:09:04

Все-таки неправ именно Малыш

>Пример как раз абсолютно верный. Если производится измерение некой физической величины (а кол-во танков именно физическая величина)

Количество танков именно не физическая величина. Освежите свои знания определния термина "физическая величина" по словарям.

Количество танков это, если угодно, арифметическая величина; ее не измеряют, а считают.

> Вы трактуете значение NULL, как нехватку информации.

Семантика его именно такова.

>Та же сумма, которую Вы считаете есть сумма только непустых значений атрибута и она Вам известна как раз точно.

О чем и речь. То что нам известно, то известно с точностью до единиц...

> То есть сумма Вам известна не с точностью до единиц, а вообще неизвестна, раз именно так Вы трактуете NULL.

... а что неизвестно, то неизвестно. К слову сказать SELECT SUM(VALUE) FROM THE_TABLE вернет вам именно сумму известных значений, в отличие от SELECT 1 + 2 + NULL.