Вышла небольшая задержка из-за моей болезни, вот присылаю ответ.
> Я вижу, что вы чем-то недовольны, но не понимаю, чем именно. Истина меня
> интересует, но я не хочу и не буду искать для вас информацию.
Если Вас интересует истина, то Вы должны быть готовы поставить эксперимент, чтобы убедиться в ложности/истинности сделанных утверждений. Но Вы этого не желаете. Будем считать, у Вас нет возможности собирать информацию.
> Из нашего
> обсуждения должно быть понятно, почему: я сомневаюсь в вашей способности
> правильно распорядиться этой информацией.
Это в принципе исключено, ведь мы научно рассматриваем проблему, а не на основе "экспертных" оценок. А научность исключает произвольность, потому что всякий результат можно повторить и проверить.
> " ... истинное значение величины (как, например, при физических
> измерениях, когда увеличением количества измерений мы повышаем точность
> его определения)..."
> Поэтому ваше пожелание смотреть "глубже" я вам возвращаю назад.
Похоже, закон больших чисел Вам не знаком. ЗБЧ указывает на то, что мы можем получить оценку истинного значения некоторого параметра (в определённых рамках). Для прогноза результата опыта с этой случайной величиной целесообразно брать именно эту ("истинную") оценку.
Вы согласны с этим утверждением?
Вы понимаете, что такое истинное значение некоторого параметра? Это его ожидание.
Теперь всё понятно?
Ещё раз объясняю:
Есть случайная величина x_t = c + u_t
c - константа u_t - "шум", ошибка, распределённая с неким законом ~ (0, D)
ЗБЧ утверждает, что среднее арифметическое x_t (т.е. функция от предыдущих наблюдений, между прочим) сходится по вероятности к c.
Теперь вопрос: нужно сделать прогноз x_t. В следующем опыте. Вы возьмёте число "от балды"? Или же ожидание?
Чему равно ожидание среднего арифметического x_t? Оно равно c.
E[ \sum_{t=1}^{N} x_t ] = c
> Давайте сыграем. Только предварительно уточним правила. Вы генерируете
> 5000 случайных чисел (вероятность 1 равна 99%, а вероятность 100 равна
> 1%). А затем сообщаете мне, какое из чисел выпало первым. Если 1 - выиграл
> я, если 100 - вы.
Нелепость. Повторяю, прогноз подразумевает массовость. В чём задача прогноза? Дать некое число, которое наименее расходится от результата эксперимента. Т.е. подразумевается некая функция пенальти, которая накладывает "штрафы" за каждое наше расхождение реального результата с прогнозом.
Дальше мы определяем функцию пенальти от полученных ошибок прогноза.
Так как это подразумевает массовость (множество различных выпадающих значений), то сама постановка у Вас бессмысленна.
Что же это за функция пенальти? Это дисперсия ошибки прогноза (как вариант).
Теперь запомните теорему: среди линейный функций мат. ожидание обладает наименьшей дисперсией ошибки прогноза.
Надеюсь, доказательство не требуется.
В чём же задача статистики? Например в том, чтобы формировать прогнозы таких экспериментов, которые мы не можем осуществить. Например, с помощью ряда элементарных теорем мы можем вычислить вероятности тех или иных событий, не прибегая непосредственно к их осуществлению. Это касается другого Вашего замечания о якобы неслучайности ВВП в будущем квартале.
Теперь касательно нашей лотереи. Думаю, можно и без генератора объяснить.
Если Вы оцениваете результат лотереи в $1 (так как вероятность 99%), то Вы всё равно будете ошибаться каждый сотый раз. Этот каждый сотый раз будет выпадать другое значение. Допустим, не 100, а 0. (безотносительно). Тогда Ваш выигрыш от лотереи при участии 100 раз будет $99, а не $100, как если бы Вы взяли Вашу функцию прогноза. Т.е. Вы будете проигрывать. Математическое же ожидание даст Вам корректную величину выигрыша ($99).
Теперь касательно прогноза. Квадрат Вашей ошибки равен 1 при 100 опытах. Для моей ошибки равен 0.99. Мой прогноз лучше. (дискретность величин тут не проблема, как Вы понимаете)
Если же брать Ваши условия, то Вы, конечно, проиграете. 5000 опытов дадут Вам $4950, а мне - $5000. Конечно, если рассматривать каждый опыт из 5000 индивидуально. Но сама по себе такая постановка опыта не имеет смысла, мы же не об этом говорим.
> Нет, не понимаю. Не понимаю, почему до вас никак не доходит, что при
> прогнозировании речь идет об одном-единственном уникальном событии. Причем
> часто о событии, которое не является случайным.
Глупости. При прогнозировании всегда подразумевается массовый эксперимент.
> Сделаю небольшое отступление в связи с лотереей, о которой вы вспомнили.
> Как известно, в любой лотерее математическое ожидание выигрыша меньше цены
> лотерейного билета. Поэтому организатор всегда оказывается в выигрыше,
> игроки (в среднем) - в проигрыше. Аналогичным образом (только наоборот,
> когда в среднем выигрывает игрок) и вы предложили мне сыграть.
> Так вот, если игроки проигрывают, то, спрашивается, почему они играют?
> Только не говорите мне, что они просто дураки. Да, те которые играют
Очень странные вопросы. Вы ведь позиционируете себя как "экономиста". Так на этот вопрос есть ответы. Например, из-за любви к риску. Или считайте это формой потребления азартных товаров. Вот и всё.
Аналогично, более здраво, для страховки. Люди не любят рисковать своим имуществом (risk aversion). Поэтому платят за "безопасность". Это рационально.
> постоянно, в конце концов все проиграют. Но если человек сыграл один раз,
> разве он не прав? Тот, кто выиграл (а кто-то обязательно выигрывает),
> безусловно, прав. Он затратил один доллар, а получил миллион. А тот, кто
> не выиграл? Он потерял свой доллар, но это для него настолько
> незначительная сумма, что ее потеря для него незаметна. Зато он имел шанс
> выиграть миллион. И для одного из игроков такой шанс реализовался.
Всё верно с точностью до наоборот. Для конкретного реального игрока закон больших чисел действительно не выполняется. Он же не может играть неограниченное (вернее хотя бы большое) число раз, срок жизни и доходы не позволяют. Поэтому ожидание выигрыша для него равно 0. Это известное семинарское заключение.
Поэтому ни один вменяемый статистик не будет играть в лотерею. Именно потому, что ожидание выигрыша меньше цены билета. Тем более экономист. Потому что есть теорема фон Неймана-Моргенштерна, которую, похоже, ни один "экономист" тутошний не знает. А ведь она элементарна и входит в любой профессиональный курс экономикс.
Но, конечно, это не отменяет закон больших чисел. Он действует, также как и любой другой "закон", при определённых условиях. В нашем случае (лотерея или вопросы прогнозирования) они выполняются, если рассматривать ситуацию как концептуальный эксперимент вообще. Известные проблемы с этим законом (вроде Санкт-Петербургского парадокса) я отмёл сразу, сказав, что парадоксами не интересуюсь.
> Итак, мы видим, что в лотерее организатор руководствуется критерием
> математического ожидания, а игроки - нет. Почему? Потому, что для
> организатора действует закон больших чисел (лотерейных билетов много), а
> для одного, отдельно взятого игрока - нет. Ведь он покупает только один
Ещё скажите, для одного, отдельно взятого игрока не действует закон тяготения. Надо же, Иванов-Гуревич отменил закон больших чисел для себя. Прямо как Бетховен статистики :)
Закон больших чисел действует в данном случае всегда, независимо. Ведь речь идёт об эксперименте "вообще". Для игрока же не выполняется требование массовости, но это не означает, что он поступает рационально. Как раз напротив, выигрыш равен 0. А проигрыш - цене билета. И это, замечу, следует из использования понятия ожидания, т.е. в рамках аппарата статистики.
Игроки поступают нерационально, вот и всё (либо потребляют "азарт"). Вас это удивляет? Вас удивляет, что статистика способна предсказать результаты такого опыта? Ничем не могу помочь. С точки зрения статистики в лотерею играть нерационально.
> лотерейный билет. Похоже, что в детстве вы не читали "Занимательную
> математику" Перельмана.
Зато сейчас читаю Феллера.
> Однако, я не понимаю, зачем вы проигнорировали мой простой и ясный пример
> и начали что-то такое изобретать свое.
Чтобы продемонстрировать Вам простую мысль: Ваш критерий произволен и не отвечает поставленной задаче. Я могу взять произвольную точку и придать ей очень небольшое превышение вероятности над другими. Как функция прогноза она будет никудышной.
> >Насколько хорош прогноз команды И-Гуревича?
> Нет бы в этом месте остановиться и задуматься: а по какому критерию мы
> отличаем хороший прогноз от плохого? Нет, полетел дальше.
Мало задуматься, надо знать или хотя бы разумно предполагать. Я критерий выше обозначил.
> >Только максимальное абсолютное расхождение составляет 100! А у A-Putt -
> только 52, почти в два раза меньше. Различие же в дисперсии (разброс)
> прогнозов будет много больше.
> Расхождение чего с чем? По-видимому, результата эксперимента с прогнозом?
Расхождение "прогноза" с результатом эксперимента.
> А какого именно поросенка мы выбрали в результате нашего (единственного!)
> эксперимента? Откуда вы знаете, что он весит 152 кг, а не 200?
Случайного, г-н Гуревич. Пора уже уяснить, что речь идёт о массовом эксперименте, который предполагает, что на следующем шаге мы будем наблюдать некий результат - образующийся в соответствии с заданным распределением.
> Может быть, вы хотите выбирать поросят много раз и смотреть, чей прогноз
> сбывается чаще? Тогда вы проиграли: вес 152 кг будет встречаться в среднем
> в 1% случаев, а вес 200 кг - в 2%.
Не чаще, а тот, который лучше отражает поставленную задачу.
> И не нужно оправдываться, что вы хотели минимизировать среднее отклонение
> фактического веса от прогнозного, а для этого как раз и нужно много раз
> проводить эксперимент и использовать математическое ожидание. Все это мне
> прекрасно известно.
Вот и хорошо. Тогда о чём был спор?
> Лучше обратите внимание на тот факт, что при решении
> задачи о поросятах в моей интерпретации (а также в моем примере с
> прогнозом погоды, и в случае лотереи) критерий математического ожидания не
> годится.
Это почему ещё?
> >(хотя, например, ещё такой, простой: величина распределена равномерно на
> интервале значений. Какой её "прогноз"?)
> Ну, и какой, по-вашему? Правильный ответ такой: с равным основанием мы
> можем ожидать появление любого значения, принадлежащего данному интервалу.
> Вот такой прогноз, лучшего мы дать не можем.
Т.е. Вам безразлично, какое число назвать. А мне нет. Я уже объяснил, почему.
> >Случайная величина - исход эксперимента с которой не может быть заранее
> указан.
> Не будем фантазировать, а лучше прочитаем в учебнике: "Случайное явление -
> это такое явление, которое при неоднократном воспроизведении одного и того
> же опыта (испытания, эксперимента) протекает каждый раз несколько
> по-иному".
И что? Это опровергает моё определение? Вот беру первый попавшийся учебник с полки: "...случайное явление - это как раз такое явление, предсказать исход которого невозможно" (Севастьянов. 1982). Запутались уже в трёх соснах?
> И далее: "Методы теории вероятностей приспособлены только для
> исследования массовых случайных явлений; они не дают возможность
> предсказать исход отдельного случайного явления, но дают возможность
> предсказать средний суммарный результат массы однородных случайных
> явлений..."
Ну да. В чём проблема? Или Вам просто читать понравилось, Вы остановиться не можете? :)
> Во-первых, я ничего не перепутал. Разницу между случайной величиной и ее
> реализацией я знаю. Во-вторых, если бы ВВП даже и был случайной величиной,
> то прогнозируемое значение ВВП в следующем году - это именно реализация
> случайной величины, а методы теории вероятностей "не дают возможность
> предсказать исход отдельного случайного явления" (см. учебник).
Тяжёлый случай. Если точный исход эксперимента нельзя предсказать, следует ли из этого, что нельзя делать прогноз? Не следует. Для этого и есть статистика.
Например, нельзя предсказать исход следующего броска кубика. Он случаен. Но можно сделать прогноз, скажем, числа точек, которые выпадут (в среднем, т.е. при гипотетическом повторении опыта). Реально может выпасть любое число точек. Но если задумать ситуацию, когда этот опыт прогнозирования повторяется, то наш прогноз будет обладать лучшими свойствами, чем произвольное число (вроде 0 или -100 или 100).
А можно, как в случае погоды, получить некий доверительный интервал, который будет характеризовать результат достоверным образом. На практике интерес, конечно, часто обращён прежде всего к нему (а не к конкретному числу - ожиданию).
> В-третьих,
> ВВП не является случайной величиной, поскольку случайное явление
> проявляется при "при неоднократном воспроизведении одного и того же
> опыта". Как мог экономист додуматься до того, что ВВП страны в разные годы
> - это реализация одного и того же опыта?
Экономическую статистику изучает эконометрика на основе несколько другого аппарата (хоть и аналогичного). Поэтому то, что пишут в советских учебниках теории вероятностей не всегда можно буквально переносить в область эконометрики, где эти проблемы решаются. Я Вам привёл цитаты Granger на тему экономических переменных, кроме того не пожалел время на просвещение Вас в области асимптотики. Надо полагать, возражений нет?
Поэтому, объясняю ещё раз. ВВП - это случайная величина, зависимая от предыдущих наблюдений. Для прогноза будущего значения ВВП поэтому целесообразно использовать реализацию предыдущих значений ВВП.
Реализация случайной величины перестаёт быть случайной величиной, само собой, раз мы её наблюдаем. Но на данный момент ВВП в 2008 г. является случайной величиной, распределённой согласно некоторому закону (статистические свойства которого вытекают за рамки Вашего учебника теории вероятностей).
Почему же так? Это связано с рядом проблем, как пример: присущие ошибки измерения, невозможность измерения чисто экономических переменных (реальные замеряемые переменные не соответствуют теоретическим), отсутствие возможности контроля за процессом измерения и т.п. Это раскрывается у Хаавельмо в его работе 40-ых гг.
Как пример можно назвать некую модель, которая связывает выпуск с задействованностью факторов производства. Если в такой модели нет практически неограниченного числа других переменных (коррупция, внешняя торговля, уровень образования и т.п.), то отклонения измеряемого показателя (ВВП) будут носит случайный характер по отношению к моделируемым переменным.
> Кстати, совсем недавно вы были сторонником институционализма и совали его
> куда надо и не надо, а всякое формальное моделирование отметали напрочь.
> Сегодня вы уже об этом забыли, ни от каких институтов ВВП не зависит, все
> в экономике случайно и только стохастические модели нас спасут.
Вопросы статистического моделирования прекрасно уживаются с вопросами институциональной политики. Институционализм ведь полагается на инструменты моделирования в описании действующих социальных моделей. Так что не вижу проблем.
Хотя да, была критика эконометрики годах так в 70-ых со стороны системной динамики. Но она во многом устарела.
> Где, в случае с ВВП (если не забыли, мы об этом говорим) у нас один опыт,
> неограниченность его повторений и бесконечность времени?
В уме, как и весь статистический аппарат. Я не поленюсь набить цитату:
"In a rough way we may characterize this concept [probability - A.P.] by saying that our probabilities do not refer to judgements but to possible outcomes of a conceptual experiment. Before we speak of probabilities, we must agree on an idealized model of a particular conceptual experiment such as tossing a coin, sampling kangaroos on the moon, observing a particle under diffusion, counting the number of telephone calls... This is analogous to the procedure in mechanics where fictitious models involving two, three, or seventeen mass points are introduced, these points being devoid of individual properties. ... By the same token, we shall not worry whether or not our conceptual experiments can be performed; we shall analyze abstract models. In the back of our minds we keep an intuitive interpretation of probability which gains operational meaning in certain applications. We imagine the experiment performed a great many times."
Feller, W. (1968). An Introduction to Probability Theory and Its Applications. V1, 3rd Ed. Wiley.
По неограниченности опыта: подразумевается "опыт" с измерением ВВП на данный момент времени, который может протекать (концептуально) бесконечное число раз, давая некие (неидентичные) результаты. По неограниченности времени: Подразумевая сходимость ряда 1/n к 0, нужно ли Вам в практической работе n -> inf или же Вы удовлетворитесь меньшими n? В реальной статистической работе изучаемые серии сходятся к достаточно точным "истинным" значениям при числе наблюдений около 200 (зависит от класса моделей).
Наконец, Вы меня просто в тупик ставите своим вопросом. Вы хотя бы потрудитесь взглянуть на реальную серию ВВП. Вы берёте смелость на себя утверждать, что это - не случайный процесс?
> Вы утверждаете, что ВВП в 2007 г. и в 1907 г. принадлежат к выборке из
> одной генеральной совокупности, т.е. это все результаты одного и того же
> опыта? Да, что тут скажешь...
Не надо приписывать мне всякие глупости. Я утверждал, что для данного года ВВП - случайная величина. Эта величина не независима с самой собой за прошлые периоды времени.
Т.е. Cov( x(t), x(t-j) ) не равно 0 для положительного j
Именно об этом говорит Granger, когда приводит пример с бусами.
В классической же статистике (например, для тех техник, которые рассматриваются в учебниках теории вероятностей) Cov( x(t), x(t-j) ) = 0.
> >ВВП - случайная величина.
> Это неправильно, и я долго пытался вам это объяснить. Видно, не удалось.
Что "неправильно"? Вы отрицаете ошибки измерения в ВВП? Вы утверждаете, что наблюдаемая серия ВВП изменяется строго детерминировано? Давайте конкретнее.
> Девица приятной наружности сегодня мне сказала, что завтра ожидается
> дождь. Этот прогноз не имеет ни малейшей связи с тем, шел или нет дождь в
> этот день в прошлом году. Чтобы понимать такую простую вещь не обязательно
> быть метеорологом.
Угу. Надо просто вычислить Cov( x(t), x(t-j) ) для j = 365, всего-то делов. Теперь понимаете мою тягу к реальным данным?
> Вы плохо объясняете. Сбиваетесь на общие, не относящиеся к делу вопросы. А
> наш вопрос такой: насколько хороша методика прогнозирования будущего
> значения ВВП страны по значениям ВВП за предыдущие годы? Вместо
> обоснования вашего ответа вы отсылаете меня к посторонним моделям.
Я Вас отсылаю к "индустриальным" методам. Т.е. к тем, которые практикуются в реальной науке и которые используются при составлении реальных прогнозов. Ваш же вопрос тривиален. Для прогнозирования ВВП за будущие годы требуется создать его вероятностную модель, т.е. описать случайный процесс, который соответствует наблюдаемым значениям. Задача прогнозирования - это задача формирования условного ожидания по отношению к известным реализациям. Так как существует ковариация между будущим значением ВВП и прошлыми значениями (лагом), то вполне здраво использовать эти предыдущие значения для таких целей.
Само собой, требуется корректно описать сам случайный процесс, чтобы схватить структуру возмущений и т.п. Для этого и применяются специальные методы.
При этом использование univariate методики часто даёт хорошие результаты по отношению к "большим" моделям - о чём недвусмысленно говорит цитата и ссылка.
> Очевидно, вы сейчас обучаетесь прогнозированию биржевых индексов на основе
> временных рядов и решили, что эти методы универсальны?
Из Вас плохой "прогнозист". Да и экономист никудышный. Иначе бы Вы знали, что экономикс без time series не бывает.
" Econometrics is now used in virtually every field of economics, including public finance, monetary economics, labor economics, international economics, economic history, health economics, studies of fertility, and studies of criminal behavior, just to mention a few. " (Griliches & Intriligator)
> Чепуха. Не ставки налогов зависят от макроэкономических параметров, а,
> наоборот, эти параметры зависят от ставок. А ставки налогов назначаются
> правительством. Вы опять сказали глупость и упорствуете.
Ууу, а Вам не приходит в голову, что правительство устанавливает ставки налогов для оптимизации тех самых "макроэкономических параметров"?
В таком случае мы имеем функцию. Эта функция - от аргументов, которые - случайные величины.
> >Не путайте метод и научность. Автоматизированная покраска автомобилей -
> это метод решения ряда задач. Но это ненаучный метод.
> Ну и что?
А то, что экспертные оценки - это метод сбора данных, а не научного анализа.
> Сведения из OPEC - это как раз и есть экспертные оценки, которые вы так не
> любите, но без которых обойтись не можете.
Это не экспертные оценки, это так и есть на самом деле (с). Я не понимаю Вашей проблемы. Квоты добычи OPEC не являются закрытой информацией, потому что легко могут быть получены всяким желающим на основе свободно доступных источников. Просто возьмите экспорт нефтепродуктов стран OPEC.
> Я думал, намек понятен. Нет, так придется разжевать. Количество защищенных
> диссертаций может равняться 0, 1 (кандидатская) и 2 (кандидатская и
> докторская). Вопрос "сколько диссертаций ты защитил?" задает человек,
> который защитил их две.
Не две, потому что докторская неэквивалентна кандидатской. Хотя можно возразить по типу шкал.
> Тому, кто пока еще не защитил ни одной, но уже
> "знает", как это нужно делать, и поучает других. Предполагается, что после
> этого вопроса он должен прикусить язык и вести себя скромнее.
Это всё неправильно. Если в диссертации есть работа с литературой и адекватно применяются адекватные методы, то никакие советы "секретарей" тут не к месту. Если же этого нет, то не понятно, как диссертация была допущена к защите. Впрочем, в России защиты - бутафорские, как и диссертации. "Секретарь" - лучший друг "научного руководителя". Диссертант - ставит банкет на защиту. "Защищается" по применению метода экспертных оценок в такой-то индустрии. Работа составлена из копирования чужих (таких же липовых!) публикаций из сети. Всё проплачено, кому надо в карман сунуто.