Обсуждение статьи "Регрессионный анализ влияния макроэкономических данных на изменение цен валют" - страница 2

 
Salavat:

Пока других подходов не найдено...

А вот тут вы сильно не правы
 
ок. Спорить не буду, перефразирую:  Из множества альтернатив предлагаю обратить и на такой метод, изложенный в статье, как перспективный
 
Salavat:
ок. Спорить не буду, перефразирую:  Из множества альтернатив предлагаю обратить и на такой метод, изложенный в статье, как перспективный

Изложенный вами инструмент может оказаться несомненно полезным при следующих обстоятельствах.

1. В трудах по построению ТС, в которой используется большое количество независимых переменных, несколько десятков или сотен, приведенный вами поход будет полезен для обозначения каких-то направлений поиска. Если эти формальные направления сопряжены с содержательными рассуждениями о влиянии независимой переменной на зависимую и о взаимном влиянии независимых переменных, то вполне нормально.

 

2. Предложенный Вами инструмент как переходной этап к бОльшему набору инструментов. Дело в том, что СТАТИСТИКА насколько мне помнится, - это очень ограниченный инструментарий и не соответствует современным возможностям. Сделав этот  первый шаг на пути анализа знАчимости переменных для целевой переменной, будет естественным переход к большому набору инструментов, например, предлагаемых оболочкой caret в R. 

 
Гораздо больше вопросов вызывает источник данных. Какой релиз макроэкономических показателей использовался? Часто подобные данные отмечены не датой выхода, а датой конца периода, к которому они относятся. Поэтому, используя, например, серию ВВП не первого релиза можно легко заглянуть в будущее на полгода (не говоря уже о пересмотре методик расчётов и перерисовке десятков лет истории, как недавно было с ВВП США).
 

Статья интересная. Спасибо. Но она более похожа на руководство по использованию Статистики. И в ней много заблуждений.

  1. Прогноз (и это слово встречается в зоголовке Уравнение регрессии и итоговый прогноз) на 5 дней используя макроэкономические показатели это нонсенс. Макроэкономические показатели выходят по месяцам и кварталам и потом корректируются на протяжении нескольких месяцев. К тому же в макроэкономических показателях много шума даже на квартальных и годовых интервалах, не говоря уже о дневных.
  2. Статья мало объясняет как выбирались эти макроэкономические показатели. Просто взяты 99 наиболее популярных, часто упоминающихся в новостях. Почти все они не способны предсказать рынок так как они сами как и рынок являются lagging, not leading. Даже если взять Factory Orders или Building Permits, хотя они и считаются leading, на самом деле таковыми они не являются так как включают в себя составляющие показатели, которые были уже оглашённы пару месяцев назад и на которые маркет уже среагировал. Открою вам за бесплатно секрет: ищите разные показатели Consumption, которых у вас в списке данных нет. Они то и явяются truly leading. Как Consumption пошло вниз, Factory Orders и Building Permits пошли вниз, а с ними GDP и рынок. Так что всё начинается с Consumption. Это даже в Марксовском Капитале хорошо описано.
  3. Регрессионный анализ даже очень применим к экономическим моделям. faa1947 пользуется какими-то догмами вместо того чтобы вникнуть в суть математического метода. Проблема не в методе а в данных и их подготовке. Данные должны быть стационарными, не важно идёт ли речь тут о регресси или об "управляемом процессе". Экономические данные в своём исходном виде нестационарны. Но они легко преобразуются в стационарные, например дифференцированием и нормализацией.
  4. Проблема регрессии в том что в любой моделируемый ряд можно вписать любуй другой ряд, даже совершенно не относящийся к моделируемому, если таких входных рядов выбрано достаточно много. Например, в форексные цены можно с успехом вписать колебания температуры воздуха на Аляске, данные о загрязнения воздуха в Лос Анжелесе, и т.п. Ошибку регрессии можно довести до нуля вписывая такие "постороннии данные". Точность прогноза тоже будет нулём. Поэтому нужно знать как правильно выбирать данные, сколько и с какой задержкой.
  5. Знание механизма функционирования компаний тоже полезно. Например, все любят цитировать Unemployment Rate. Считают этот показатель барометром экономики. Но на самом деле как уровень безработицы пошёл вверх, уже поздно реагировать так как экономка уже в упаде и давно. Проблема с UR в том что он включает всех старше 16 лет. Существуют десятки разных показателей безработицы среди разных слоёв населения и разного рода деятельности. Вот запрос на засыпочку: если компании видят понижение запроса на их продукты, кого они начинают увольнять первыми? И второй вопрос: какие компании первыми чувствуют упадок спроса?
 
gpwr:

Статья интересная. Спасибо. Но она более похожа на руководство по использованию Статистики. И в ней много заблуждений.

  1. Прогноз (и это слово встречается в зоголовке Уравнение регрессии и итоговый прогноз) на 5 дней используя макроэкономические показатели это нонсенс. Макроэкономические показатели выходят по месяцам и кварталам и потом корректируются на протяжении нескольких месяцев. К тому же в макроэкономических показателях много шума даже на квартальных и годовых интервалах, не говоря уже о дневных.
  2. Статья мало объясняет как выбирались эти макроэкономические показатели. Просто взяты 99 наиболее популярных, часто упоминающихся в новостях. Почти все они не способны предсказать рынок так как они сами как и рынок являются lagging, not leading. Даже если взять Factory Orders или Building Permits, хотя они и считаются leading, на самом деле таковыми они не являются так как включают в себя составляющие показатели, которые были уже оглашённы пару месяцев назад и на которые маркет уже среагировал. Открою вам за бесплатно секрет: ищите разные показатели Consumption, которых у вас в списке данных нет. Они то и явяются truly leading. Как Consumption пошло вниз, Factory Orders и Building Permits пошли вниз, а с ними GDP и рынок. Так что всё начинается с Consumption. Это даже в Марксовском Капитале хорошо описано.
  3. Регрессионный анализ даже очень применим к экономическим моделям. faa1947 пользуется какими-то догмами вместо того чтобы вникнуть в суть математического метода. Проблема не в методе а в данных и их подготовке. Данные должны быть стационарными, не важно идёт ли речь тут о регресси или об "управляемом процессе". Экономические данные в своём исходном виде нестационарны. Но они легко преобразуются в стационарные, например дифференцированием и нормализацией.
  4. Проблема регрессии в том что в любой моделируемый ряд можно вписать любуй другой ряд, даже совершенно не относящийся к моделируемому, если таких входных рядов выбрано достаточно много. Например, в форексные цены можно с успехом вписать колебания температуры воздуха на Аляске, данные о загрязнения воздуха в Лос Анжелесе, и т.п. Ошибку регрессии можно довести до нуля вписывая такие "постороннии данные". Точность прогноза тоже будет нулём. Поэтому нужно знать как правильно выбирать данные, сколько и с какой задержкой.
  5. Знание механизма функционирования компаний тоже полезно. Например, все любят цитировать Unemployment Rate. Считают этот показатель барометром экономики. Но на самом деле как уровень безработицы пошёл вверх, уже поздно реагировать так как экономка уже в упаде и давно. Проблема с UR в том что он включает всех старше 16 лет. Существуют десятки разных показателей безработицы среди разных слоёв населения и разного рода деятельности. Вот запрос на засыпочку: если компании видят понижение запроса на их продукты, кого они начинают увольнять первыми? И второй вопрос: какие компании первыми чувствуют упадок спроса?

Я не полно изложил свою точку зрения и ниже попытаюсь кратко восполнить, может быть повторяясь.

1. Проблема выбора исходных данных - предикторов, является фундаментальной, плохо формализуемой и больше тяготеет к искусству, чем к науке. Не будем забывать один из базовых постулатов статистики: "Мусор на входе - мусор на выходе".

2. Как писал выше, более половины времени при построении модели тратится на подбор и обоснования перечня и вида исходных данных. Причем ведущее значение имеет как раз содержательное толкование исходных данных, а не их формальные, статистические характеристики. Матаппарат - вспомогательное средство для содержательного подбора исходных данных.

3. В соответствии с литературой я различаю два вида прогноза: один прогноз, второй предсказание.

4.  Прогноз: берем историю и экстраполируем ее в будущее на несколько шагов вперед. Классика: берем машку и экстраполируем ее вперед. Основная проблема - ошибка накапливается при увеличении количества шагов вперед, так как следующее значение основано на предыдущем

5. Предсказание: получаем текущий набор исходных данных и без всякой предистории предсказываем будущее.  Предыдущее значение не используется, т.е. если предсказываем +5, то для этого не нужны нам предыдущии 4 значения в отличии от прогноза.

5. Кроме исходных данных очень важно ЧТО МЫ ПРЕДСКАЗЫВАЕМ. При торговле у нас два вида приказов (с вариантами) купить и продать. По регрессиям мы почему-то предсказываем будущее значение цены и из этого значения цены делаем вывод "купить-продать". При этом забываем об ошибке прогноза. а если учесть ошибку и строить решение "купить-продать" с учетом доверительном интервала, то быстро выясняется, что решений принять не возможно. Из этого следует: РЕГРЕССИОННЫЕ МОДЕЛИ, ПРОГНОЗИРУЮЩИЕ ЗНАЧЕНИЕ - БЕЗНАДЕЖНЫ.

6. Предсказывать надо направление тренда, что совпадает с приказами торговых систем.  Это делается по моделям классификации, которые способны предсказывать значения: "лонг-шорт" или "лонг-боковик-шорт", или еще что-либо качественное, но не количественное, типа: будущее значение пары = 1.3500.

7. Для построения моделей классификации данная статья может оказаться очень полезной. 

 
gpwr:

Статья интересная. Спасибо. Но она более похожа на руководство по использованию Статистики. И в ней много заблуждений.

С возвращением на сайт. ;-)  Надеюсь, надолго. Наконец-то будет что почитать полезного и содержательного.
 

Вот пример предсказания S&P500 моей регрессионной моделью. Чёрная линия - исторический индекс, сплошная горизонтальная синия это квартальная средняя, пунктирная линия это предсказания. Предсказания идут кварталами. Точность предсказаний не такая уж большая, но достаточна для предсказаний характера движений: вниз, верх, флэт. Модель предсказывает что рынок пойдёт вниз в оставшиеся 3.5 месяца этого года, ли в лучшем случае будет флэт. Использую данные предсказания только для того чтобы вовремя убраться из рынка.

 

Вопрос или просьба автору - в полученной модели перейдите, пожалуйста, в результатах на вкладку Advanced и нажмите на кнопку Partial Correlations.

Опубликуйте тут, если не трудно, значение коэффициентов PC для каждого из факторов модели. 

 
Demi:

Вопрос или просьба автору - в полученной модели перейдите, пожалуйста, в результатах на вкладку Advanced и нажмите на кнопку Partial Correlations.

Опубликуйте тут, если не трудно, значение коэффициентов PC для каждого из факторов модели. 

все операции вы можете сделать сами, файл с подготовленными данными прикреплен в статье в архиве calendar_2010-2011_usd_out.zip 

 
b*in Partial Cor. Semipart Cor. Tolerance R-square t(357) p-value
изменение цены за 1 сутки 0.3500049 0.3883344 0.3045530 0.7571426 0.2428574 7.9622506 0.0000000
изменение цены за 10 суток 0.3271369 0.3623699 0.2809839 0.7377407 0.2622593 7.3460567 0.0000000
USD Existing Home Sales (MoM) 0.4499016 0.2746573 0.2064353 0.2105391 0.7894609 5.3970552 0.0000001
USD MBA Mortgage Applications -0.1070692 -0.1315908 -0.0959356 0.8028431 0.1971569 -2.5081463 0.0125795
USD Employment Cost Index 1.1924082 0.3459071 0.2664363 0.0499272 0.9500728 6.9657258 0.0000000
USD NAPM-Milwaukee 0.4918679 0.3281278 0.2510388 0.2604862 0.7395138 6.5631723 0.0000000
USD Existing Home Sales -0.6131716 -0.3510242 -0.2709271 0.1952275 0.8047725 -7.0831333 0.0000000
USD Unemployment Rate -0.2303595 -0.1174173 -0.0854492 0.1375953 0.8624047 -2.2339883 0.0261025
USD ISM Manufacturing 0.4683029 0.2807841 0.2114298 0.2038349 0.7961651 5.5276311 0.0000001
USD Capital Goods Orders Non defense Excluding Air -1.0522008 -0.3326872 -0.2549579 0.0587137 0.9412863 -6.6656324 0.0000000
USD Durables Ex Transportation 1.0195595 0.3332286 0.2554246 0.0627625 0.9372375 6.6778344 0.0000000
USD House Price Purchase Index (QoQ) -0.6493641 -0.3164098 -0.2410558 0.1378030 0.8621970 -6.3021765 0.0000000
USD Chicago Purchasing Manager -0.7364752 -0.2854029 -0.2152134 0.0853930 0.9146070 -5.6265502 0.0000000
USD Personal Consumption Expenditure Core (YoY) -0.5430761 -0.2067342 -0.1527068 0.0790670 0.9209330 -3.9923747 0.0000794
Причина обращения: