От Дмитрий Кропотов
К Alexandre Putt
Дата 02.05.2006 15:35:24
Рубрики Россия-СССР; Теоремы, доктрины;

Нет, это вы не поняли

Привет!

>>Перечитайте еще раз мое сообщение. Если на протяжении длительного статистического ряда наблюдается корреляция между двумя переменными,
>
>Там нет корреляции, потому что Вы опираетесь на spurious regression. Полистайте конец учебника по теории вероятности (про эргодичность, стационарность и тд), там это объясняется. Или любой учебник по эконометрике.
Корреляция есть, т.к. успешно считается. Т.е. по изменениям одной величины можно судить об изменениях другой величины.
Этого достаточно.

>Для этого её необходимо правильно обсчитать.
Она правильно обсчитана.


Дмитрий Кропотов, www.avn-chel.nm.ru

От Alexandre Putt
К Дмитрий Кропотов (02.05.2006 15:35:24)
Дата 02.05.2006 15:52:41

Re: Нет, это...

>Корреляция есть, т.к. успешно считается.

То, что считается не говорит о том, что она имеет смысл. Смысл она не имеет, потому что процессы нестационарные. Ксли рассмотреть приращения наблюдений (т.е. отнять от каждого наблюдения предыдущее значение) и тем самым превратить процессы в стационарные, то (опуская сомнительность спецификации), квадрат коэф. корреляции равен 0,25. Т.е. значительно меньше, чем Вы хотели бы думать.

От Дмитрий Кропотов
К Alexandre Putt (02.05.2006 15:52:41)
Дата 02.05.2006 16:27:53

Re: Нет, это...

Привет!
>>Корреляция есть, т.к. успешно считается.
>
>То, что считается не говорит о том, что она имеет смысл. Смысл она не имеет, потому что процессы нестационарные. Ксли рассмотреть приращения наблюдений (т.е. отнять от каждого наблюдения предыдущее значение) и тем самым превратить процессы в стационарные, то (опуская сомнительность спецификации), квадрат коэф. корреляции равен 0,25. Т.е. значительно меньше, чем Вы хотели бы думать.

Я посчитал, и так, как вы предложили, но коэф. получается 0.41, а не 0.25.


Дмитрий Кропотов, www.avn-chel.nm.ru

От Alexandre Putt
К Дмитрий Кропотов (02.05.2006 16:27:53)
Дата 02.05.2006 16:36:02

Я дал R^2

>Я посчитал, и так, как вы предложили, но коэф. получается 0.41, а не 0.25.

Для наипростейшей линейной регрессии. Соответственно, коэф. = корень из R^2. + я считал после логарифмического преобразования, которое стандартно применяется.

(пробелы потеряны)

Dependent Variable is D1Log_PROD
Observations 2-47 used for estimation.
Estimation Method: Ordinary Least Squares
Estimate Std. Err. t Ratio p-Value
Intercept 0.01323 0.00757 1.748 0.087
D1Log_ELECTR 0.53291 0.12423 4.289 0
Log Likelihood = 85.3097
Schwarz Criterion = 81.4811
Hannan-Quinn Criterion = 82.6247
Akaike Criterion = 83.3097
Sum of Squares = 0.0659
R-Squared = 0.25
Residual SD = 0.0387
Residual skewness = -1.0271
Residual kurtosis = 4.225
Jarque-Bera Test = 10.9639 {0.004}
Box-Pierce (residuals): Q(12) = 3.8548 {0.985}
Box-Pierce (squared residuals): Q(12) = 7.0429 {0.854}

Covariance matrix from robust formula.
...Run completed in 0.49

От Дмитрий Кропотов
К Дмитрий Кропотов (02.05.2006 15:35:24)
Дата 02.05.2006 15:40:06

еще поясню

Привет!
так как вижу, что вы не понимаете.

Скажем, возьмем два ряда - ряд натуральных чисел и ряд их квадратов и посчитаем коэф.корреляции, который для ряда из 20 чисел будет 0.97.

Теперь представим, что второй ряд нам неизвестен, а известен лишь первый. Но, на основании известного и высокого коэф.корреляции, динамику изменения второго ряда мы можем надежно экстраполировать по динамике изменения первого ряда.


Дмитрий Кропотов, www.avn-chel.nm.ru

От Alexandre Putt
К Дмитрий Кропотов (02.05.2006 15:40:06)
Дата 02.05.2006 16:13:10

Для предсказания всё это актуально тем более

>Скажем, возьмем два ряда - ряд натуральных чисел и ряд их квадратов и посчитаем коэф.корреляции, который для ряда из 20 чисел будет 0.97.

Вы будете использовать регрессию одной серии на другую, чтобы получить оценки параметров. Так вот, это абсолютная анафема для нестационарных процессов. Оценки параметров сходятся по вероятности к истинным только при соблюдении пресловутых допущений (например, классическое iid - независимо и идентично (пост. дисперсия) распределённая случайная величина, в реальной экономике никогда не встречается). В Вашем случае никакой сходимости и подавно нет, а обсчитанные параметы начнут немедленно врать (давать неверное предсказание) за пределами наблюдений, которые использовались для оценки.

От Дмитрий Кропотов
К Alexandre Putt (02.05.2006 16:13:10)
Дата 02.05.2006 16:33:34

Я веду речь не о предсказании

Привет!
>>Скажем, возьмем два ряда - ряд натуральных чисел и ряд их квадратов и посчитаем коэф.корреляции, который для ряда из 20 чисел будет 0.97.
>
>Вы будете использовать регрессию одной серии на другую, чтобы получить оценки параметров. Так вот, это абсолютная анафема для нестационарных процессов. Оценки параметров сходятся по вероятности к истинным только при соблюдении пресловутых допущений (например, классическое iid - независимо и идентично (пост. дисперсия) распределённая случайная величина, в реальной экономике никогда не встречается). В Вашем случае никакой сходимости и подавно нет, а обсчитанные параметы начнут немедленно врать (давать неверное предсказание) за пределами наблюдений, которые использовались для оценки.

А как раз для экстраполяции внутри ряда наблюдений, который использовался для оценки.

Дмитрий Кропотов, www.avn-chel.nm.ru

От Alexandre Putt
К Дмитрий Кропотов (02.05.2006 16:33:34)
Дата 02.05.2006 16:37:01

Одно и тоже (-)


От Alexandre Putt
К Дмитрий Кропотов (02.05.2006 15:40:06)
Дата 02.05.2006 16:04:15

О допущениях

>Скажем, возьмем два ряда - ряд натуральных чисел и ряд их квадратов и посчитаем коэф.корреляции, который для ряда из 20 чисел будет 0.97.

>Теперь представим, что второй ряд нам неизвестен, а известен лишь первый. Но, на основании известного и высокого коэф.корреляции, динамику изменения второго ряда мы можем надежно экстраполировать по динамике изменения первого ряда.

Это всё к статистике отношения не имеет, потому что она работает не с натуральными числами, а опытными данными.
Соответствующий результат широко известен. Поясняю:
если процессы нестационарные, то, даже если они не имеют ничего общего между собой, регрессия одно на другой даёт высокий коэффициент корреляции. Этот результат известен с 20-ых гг прошлого века (или даже раньше). Если не верите, могу продемонстрировать.

Вывод из этого: любые стат. манипуляции с данными должны соответствовать ряду допущений (например, стационарность) либо вводить коррекцию на нарушения. Тесты на нестационарность давно разработаны и популяризованы. Если нестационарность имеет место (а это так почти во всех экономических сериях), то необходимо преобразовать данные: вычесть тренд (если имеет место) либо взять разницу процесса (если имеет место unit root (единичный корень)). Это в общих чертах.

От Дмитрий Кропотов
К Alexandre Putt (02.05.2006 16:04:15)
Дата 02.05.2006 16:22:26

Тут не о статистике речь

Привет!

Вы опять не поняли.
Попробую еще упростить. Известен индекс производства э-энергии. Из эмпирических соображений очевидно, что рост пр-ва э-энергии связан с ростом пром. производства. Вопрос - насколько мы можем, зная динамику пр-ва э-энергии достоверно судить о динамике пром. пр-ва? Ответ - если коэф. корреляции этих рядов высок, т.е. они согласованно меняются (абстрагируясь от трендов, причинно-следственных связей и т.д.) - следовательно, по динамике одного можно делать обоснованные предположения о динамике другого.
Вы же все пытаетесь обратить мое внимание, что для выявления причинно-следственной связи простого вычисления коэф. корреляции недостаточно. Я с этим и не спорю, моя задача сейчас другая.



Дмитрий Кропотов, www.avn-chel.nm.ru

От Alexandre Putt
К Дмитрий Кропотов (02.05.2006 16:22:26)
Дата 02.05.2006 16:30:51

Именно о статистике. И как раз я Вас отлично понимаю

> Вопрос - насколько мы можем, зная динамику пр-ва э-энергии достоверно судить о динамике пром. пр-ва? Ответ - если коэф. корреляции этих рядов высок, т.е. они согласованно меняются (абстрагируясь от трендов, причинно-следственных связей и т.д.) - следовательно, по динамике одного можно делать обоснованные предположения о динамике другого.

Так не меняются они согласованно. Коэф. корреляции максимум 0,5. Электроэнергия объясняет только 25% вариации в пром.производстве. Это если правильно считать.

>Вы же все пытаетесь обратить мое внимание, что для выявления причинно-следственной связи простого вычисления коэф. корреляции недостаточно. Я с этим и не спорю, моя задача сейчас другая.

Статистика не выявляет причинно-следственные связи. Это делает теория. Статистика тестирует теорию, оценивает параметры моделей и позволяет делать предсказания значений.