|
От
|
Дм. Ниткин
|
|
К
|
Вячеслав
|
|
Дата
|
21.04.2010 00:03:04
|
|
Рубрики
|
Семинар;
|
|
Да, это ключевая ошибка.
>Итак, есть некоторый временной ряд с реальными данными, для них нам надо задать функцию.
Что значит "надо"? Начальник приказал?
>Для этого мы считаем, что есть некая истинная функция, которую мы аппроксимируем по имеющимся данным и другой аналитической информации, известной об этой истинной функции и делаем это так, чтобы погрешность нас удовлетворяла.
Весь фокус в том, что "истинной функции" нет. Или она есть, но очень сложна и имеет аргументом не только время, но еще несколько сотен параметров, не считая нескольких тысяч параметров, которыми можно пренебречь.
Это не значит, что нельзя временной ряд аппроксимировать какой-то гладкой функцией. Можно, никто не мешает. В конце концов, полиномом соответствующей степени Вы любой конечный ряд аппроксимируете, хоть с точностью до нуля. Вопрос - зачем?
Ответов чаще всего два. Первое - чтобы понять тенденцию. Второе - чтобы построить прогноз. И вот здесь уже начинаются интересности.
Первым делом, выясняется, что важна не столько точность приближения, сколько простота модели. Потому что чем сложнее формула - тем труднее понять, а что же, собственно, происходит?
Далее, мы обсуждаем ОПЖ, не так ли? Ну что же, в истории достаточно часто бывают случаи достаточно мощных природных или социальных катализмов, в ходе которых резко меняется и значение ОПЖ, и показатели его динамики. И получается, что для понимания тенденций надо, допустим, для периода с 1970 по 1990 год аппроксимировать одной функцией, с 1991 по 1999 - другой, а с 2000 года - третьей. А вопроса о гладкости - негладкости функции в этой ситуации нет вообще.
Что-то похожее и с прогнозом. Аппроксимирующую функцию можно использовать для прогнозирования в предположении о неизменности существующих условий и тенденций. А если ты уже имеешь информацию, что условия изменились, то аппроксимация становится бессмысленной.
Например, тот же ядерный взрыв в столице. Могу предположить, что когда выжившие демографы возобновят расчет ОПЖ, они сделают примерно следующее:
1. "Закроют" ряд наблюдений за годы, предшествующие взрыву.
2. С года, следующего за взрывом, начнут новый ряд, в котором учтут новые показатели смертности и рождаемости.
3. Для года взрыва ОПЖ вообще определять не будут, поскольку год был аномальным. Или вычислят, но в качестве казуса, непригодного для аналитики.
В общем, нет никакой "истинной функции". Просто есть желание людей работать не с длинными рядами многомерных реальных данных, а с парой-другой как можно более простых формул. Желание математически смоделировать действительность, иначе говоря.
>Так вот в ходе аппроксимации теоретически может встать проблема, а какую брать функцию - непрерывную или с разрывами. Вопрос - когда какую брать?
Это вообще не вопрос. В моделировании стараются использовать гладкие функции, потому что их легче анализировать. Но если они не дают нужной степени точности, например, из-за слома тенденции - значит, надо брать ту, которая лучше подходит.