От Вячеслав Ответить на сообщение
К Дм. Ниткин Ответить по почте
Дата 23.04.2010 14:12:12 Найти в дереве
Рубрики Семинар; Версия для печати

Re: Да, это...

>>Итак, есть некоторый временной ряд с реальными данными, для них нам надо задать функцию.
>
>Что значит "надо"? Начальник приказал?
Просто надо, а возможные причины Вы ниже прекрасно сформулировали.

>>Для этого мы считаем, что есть некая истинная функция, которую мы аппроксимируем по имеющимся данным и другой аналитической информации, известной об этой истинной функции и делаем это так, чтобы погрешность нас удовлетворяла.
>
>Весь фокус в том, что "истинной функции" нет. Или она есть, но очень сложна и имеет аргументом не только время, но еще несколько сотен параметров, не считая нескольких тысяч параметров, которыми можно пренебречь.
Нет, тогда уж истинных функций вообще нет, однако динамика показателя есть, соответственно есть некое точное соответствие значений отдельным моментам времени.

> Это не значит, что нельзя временной ряд аппроксимировать какой-то гладкой функцией. Можно, никто не мешает. В конце концов, полиномом соответствующей степени Вы любой конечный ряд аппроксимируете, хоть с точностью до нуля. Вопрос - зачем?

>Ответов чаще всего два. Первое - чтобы понять тенденцию. Второе - чтобы построить прогноз. И вот здесь уже начинаются интересности.
Вариантов обычно больше: чтобы наладить обратную связь для управления, чтобы исследовать методами матанализа , чтобы оценить значимость влияния нового фактора и т.п..

>Первым делом, выясняется, что важна не столько точность приближения, сколько простота модели. Потому что чем сложнее формула - тем труднее понять, а что же, собственно, происходит?
Вот это верно. В нашем примере шумы от ежедневных перепадов температур и сквозняков нафиг не нужны.

> Далее, мы обсуждаем ОПЖ, не так ли? Ну что же, в истории достаточно часто бывают случаи достаточно мощных природных или социальных катализмов, в ходе которых резко меняется и значение ОПЖ, и показатели его динамики. И получается, что для понимания тенденций надо, допустим, для периода с 1970 по 1990 год аппроксимировать одной функцией, с 1991 по 1999 - другой, а с 2000 года - третьей. А вопроса о гладкости - негладкости функции в этой ситуации нет вообще.
Конечно, все так, но раз оппонент настаивал что функция ОПЖ всенепременно дискретная, то вот мне и хотелось, чтобы он указал моменты, когда без дискретности принципиально не обойтись.

> Что-то похожее и с прогнозом. Аппроксимирующую функцию можно использовать для прогнозирования в предположении о неизменности существующих условий и тенденций. А если ты уже имеешь информацию, что условия изменились, то аппроксимация становится бессмысленной.
Не совсем, для корректировки прогноза вполне может потребоваться, тут конечно куча своих тонкостей, но все же.

>Например, тот же ядерный взрыв в столице. Могу предположить, что когда выжившие демографы возобновят расчет ОПЖ, они сделают примерно следующее:
>1. "Закроют" ряд наблюдений за годы, предшествующие взрыву.
>2. С года, следующего за взрывом, начнут новый ряд, в котором учтут новые показатели смертности и рождаемости.
>3. Для года взрыва ОПЖ вообще определять не будут, поскольку год был аномальным. Или вычислят, но в качестве казуса, непригодного для аналитики.
Да конечно, как вариант сделают разрыв.

> В общем, нет никакой "истинной функции". Просто есть желание людей работать не с длинными рядами многомерных реальных данных, а с парой-другой как можно более простых формул. Желание математически смоделировать действительность, иначе говоря.
Разумеется. Причем не обязательно речь о формулах, можно работать и с рядами усредненных данных.

>>Так вот в ходе аппроксимации теоретически может встать проблема, а какую брать функцию - непрерывную или с разрывами. Вопрос - когда какую брать?
>
>Это вообще не вопрос. В моделировании стараются использовать гладкие функции, потому что их легче анализировать.
В общем, конечно, не вопрос, берем что нам удобнее, но оппонент настаивал на всенепременной дискретности
> Но если они не дают нужной степени точности, например, из-за слома тенденции - значит, надо брать ту, которая лучше подходит.
Конечно, вот я и пытался сформулировать те условия, когда больше подходит разрывная функция, столь дорогая для оппонента.