Обсуждение статьи "Регрессионный анализ влияния макроэкономических данных на изменение цен валют"

 

Опубликована статья Регрессионный анализ влияния макроэкономических данных на изменение цен валют:

Фундаментальный анализ для многих представляет непонятную область: неясно как его проводить, какие параметры учитывать, а какие нет, если же учитывать, то требуется выяснить характер их влияния и как долго это влияние следует учитывать в своих сделках. Натолкнувшись на статью "Множественный регрессионный анализ: генератор стратегий и тестер в одном флаконе" в 2011, прочтя её и заинтересовавшись методом, я провел некоторые исследования по применению такого метода для фундаментального анализа, о результатах которых и пойдет речь в этой статье.

В статье рассмотрен вопрос применения множественного регрессионного анализа к данным макроэкономической статистики и анализ влияния этих данных на изменение курса валют на примере пары EURUSD. Применение такого анализа позволяет автоматизировать проведение фундаментального анализа, который становится доступным практически каждому, даже начинающим трейдерам.

Автор: Salavat Bulyakarov

 

Не ясно, на каком основании Вы считаете, что можно доверять полученным результатам?

Ведь известно, что регрессионный анализ имеет столь существенные ограничения, что практически исключает возможность его использования на финансовых рынках.

Поэтому надо доказывать, что полученным результатам можно доверять.

 

Результат работы любого анализа - создание вероятностной картины развития ситуации. Конечно же, результат полученный из составленного уравнения не является 100% гарантированным прогнозом в такой картине, т.к. в нем, к примеру, отсутствует механизм учета влияния выступлений политиков, форс-мажоры, результаты заседаний и др., Но дать вероятностную оценку изменения цены на валюту на какой то небольшой период, думаю, он может.

Второе - уравнение регрессии это тот же технический индикатор, облегчающий жизнь трейдера, а верить его показаниям или не верить зависит от самого трейдера.

В третьих, вы правы в  том, что ставите под сомнение то , что результатам можно доверять, требует доказательства, однако в своей статье я изложил алгоритм действий в картинках, приложил скрипт для генерации таблиц для экспорта ленты новостей в вид таблицы для обработки, пользуйтесь, проверяйте изложенное в статье на практике, коллективно и решим применимо ли на фин. рынках такое или требует переработки или не применимо.

 
Salavat:

Результат работы любого анализа - создание вероятностной картины развития ситуации. Конечно же, результат полученный из составленного уравнения не является 100% гарантированным прогнозом в такой картине, т.к. в нем, к примеру, отсутствует механизм учета влияния выступлений политиков, форс-мажоры, результаты заседаний и др., Но дать вероятностную оценку изменения цены на валюту на какой то небольшой период, думаю, он может.

Второе - уравнение регрессии этот же технический индикатор, облегчающий жизнь трейдера, а верить его показаниям или не верить зависит от самого трейдера.

В третьих, вы правы в  том, что ставите под сомнение то , что результатам можно доверять, требует доказательства, однако в своей статье я изложил алгоритм действий в картинках, приложил скрипт для генерации таблиц для экспорта ленты новостей в вид таблицы для обработки, пользуйтесь, проверяйте изложенное в статье на практике, коллективно и решим применимо ли на фин. рынках такое или требует переработки или не применимо.

Поднятая Вами проблема носит краеугольный характер в интеллектуальном анализе данных (Data mining). Наиболее проработана эта проблема в пакете CORELearn. Вот ссыль на документацию. Наиболее распространен, в смысле во многих пакетах, индекс Gini. Наиболее перспективен показатель Relief со своими многочисленными модификациями. 

Не оставляйте своих исследований, так как Вами поднят базовый вопрос трейдинга.

Удачи. 

 
faa1947:

...

Спасибо.

 

Забавно получилось.

Вначале вы на основе анализа определенного периода построили модель, а потом на ура доказали, что реакция рынка на событие ИЗ ЭТОГО ЖЕ ПЕРИОДА демонстрирует ожидаемое поведение. Ну так оно и понятно, модель-то уже учитывает это событие. Этакая классика подгонки. Еще более забавно то, что реакция на новостные релизы даже часами крайне редко измеряется, уж не говоря о днях.

Возможно, если вы сделаете то же самое для краткосрочных интервалов, результат будет больше приближен к жизни и у него будет возможность успешно пройти форвард-тесты

 
Vladix:

Забавно получилось.

Вначале вы на основе анализа определенного периода построили модель, а потом на ура доказали, что реакция рынка на событие ИЗ ЭТОГО ЖЕ ПЕРИОДА демонстрирует ожидаемое поведение. Ну так оно и понятно, модель-то уже учитывает это событие. Этакая классика подгонки. Еще более забавно то, что реакция на новостные релизы даже часами крайне редко измеряется, уж не говоря о днях.

Возможно, если вы сделаете то же самое для краткосрочных интервалов, результат будет больше приближен к жизни и у него будет возможность успешно пройти форвард-тесты

Статья озаглавлена "Анализ" и в ней нет речи о прогнозе, а значит о форвард-тесте.

Если о Вашем замечании, то без обоснования применимости форвард-теста делать их пустое занятие и ко всему очень опасное, так как Вы можете случайно получить удовлетворительный результат форвард теста и будете верить своей модели, а она благополучно сольет при реальной торговле. 

 
faa1947:

Статья озаглавлена "Анализ" и в ней нет речи о прогнозе, а значит о форвард-тесте.

Если о Вашем замечании, то без обоснования применимости форвард-теста делать их пустое занятие и ко всему очень опасное, так как Вы можете случайно получить удовлетворительный результат форвард теста и будете верить своей модели, а она благополучно сольет при реальной торговле. 

Я о статье не могу судить только по названию. Тема мне интересна, и я прочел ее полностью. И вот что автор пишет в заключении:

Однако хочу обратить ваше внимание на то, что прогноз не является 100% гарантией того, что валюта пойдет именно в предсказанную сторону. Результат прогноза - это вероятностное событие, наступление которого зависит от многих факторов. Кроме того, уравнение регрессии рекомендуется периодически проверять при поступлении новых данных.

Удачных прогнозов. 

Просто пожонглировать данными - это неинтересно. Автор строит модель рынка, описываемое уравнениями регрессии, а потом доказывает, что модель как бы работает, при этом используя проверку на данных, которые использовались для ее построения. Я обратил внимание именно на это, как на некую подтасовку. 

 

В свое время я намучился с фундаментальным анализом и долго пытался его хоть как то автоматизировать. Предложенный метод ФА облегчает достаточно сильно. Анализ переменных макроэкономики помогает выявить те, что могли влиять на изменение цены. Но такой анализ не дает 100% гарантии того, что в будущем они будут также актуальны. Вспомните: результаты прошлой торговли не могут являться гарантией того, что она будет такой же и в будущем.

Проверка уравнения на будущих данных может производится средствами программы. Вы это можете сделать и сами. В процессе подготовки данных ограничьте  крайнюю дату пользуясь кнопкой "Select Cases" (см. рис 13 статьи) , в открывшемся окне включите чекбокс "Enable Selection Conditions", ниже выберите "Specific, selected by:" и  в ячеке запишите интервал строк, которые учитывать "v0>0 and v0<999". Строки дальше 999 учитываться не будут.  После проведения анализа и выбора значимых переменных, вернитесь к этому окну и измените, сдвиньте интервал вперед начав  c 1000 строки и снова проверьте результаты. В программе в матрице будет показан % точности. 

Этот алгоритм составления уравнения, по идее, должен быть частью торгового робота, советника. К сожалению все полностью автоматизировать не получилось, затруднен сбор данных с сайтов выкладывающих календари, один и тот же показатель может быть написан по разному, в слове могут допустить ошибку,  и т.д. , потому , потому периоды не краткосрочные.  

Я не настаиваю на том, что данный метод является манной небесной, я просто предлагаю вам дополнительный инструмент, который может вам облегчить работу и существенно экономит ваше время.

 
Salavat:

В свое время я намучился с фундаментальным анализом и долго пытался его хоть как то автоматизировать. Предложенный метод ФА облегчает достаточно сильно. Анализ переменных макроэкономики помогает выявить те, что могли влиять на изменение цены. Но такой анализ не дает 100% гарантии того, что в будущем они будут также актуальны. Вспомните: результаты прошлой торговли не могут являться гарантией того, что она будет такой же и в будущем.

Проверка уравнения на будущих данных может производится средствами программы. Вы это можете сделать и сами. В процессе подготовки данных ограничьте  крайнюю дату пользуясь кнопкой "Select Cases" (см. рис 13 статьи) , в открывшемся окне включите чекбокс "Enable Selection Conditions", ниже выберите "Specific, selected by:" и  в ячеке запишите интервал строк, которые учитывать "v0>0 and v0<999". Строки дальше 999 учитываться не будут.  После проведения анализа и выбора значимых переменных, вернитесь к этому окну и измените, сдвиньте интервал вперед начав  c 1000 строки и снова проверьте результаты. В программе в матрице будет показан % точности. 

Этот алгоритм составления уравнения, по идее, должен быть частью торгового робота, советника. К сожалению все полностью автоматизировать не получилось, затруднен сбор данных с сайтов выкладывающих календари, один и тот же показатель может быть написан по разному, в слове могут допустить ошибку,  и т.д. , потому , потому периоды не краткосрочные.  

Я не настаиваю на том, что данный метод является манной небесной, я просто предлагаю вам дополнительный инструмент, который может вам облегчить работу и существенно экономит ваше время.

Не могу с Вами согласиться в принципе. 

Ваша модель не дает вообще никаких сведений - она вводит людей в заблуждение. И вот почему. 

 1. Регрессионные модели применимы к стационарным временным рядам. Именно поэтому существуют модели ARIMA, ARCH и масса других, которые до построения модели пытаются преобразовать исходный временной ряд в некоторый другой, но который хоть как-нибудь будет похож на стационарный ряд (мо и дисперсия равны константе).

2. После приведения исходных рядов к подобию стационарности строится регрессионная модель с единственной целью - посмотреть на разность между подгонкой от модели и реальными данными. Если эта разность (остаток - returns) стационарен, то можно делать тогда следующий шаг.

3. При положительных результатах первых двух шагов, то о чем писал  Vladix  - форвард тесты. Если результаты, полученные на наборе данных обучения модели близки результатам на тестовом и проверочном наборах данных (это три разных куска временно ряда), то только тогда можно начать говорить о доверии полученным результатам. В противм - ни в коем случае, это будет очень опасный самообман, слепая вера в цифирь.  

 

Вся проблема первых двух шагов в том, что их не удается выполнить. Главное и наиболее противное препятствие - это корреляция между зависимыми переменными - мультиколлиниарность. Существует еще другие проблемы. Этим и объясняется, что поднятая Вами проблема - определение влияния зависимых переменных на независимую пытаются решить с помощью специальных показателей, например, Gini, Relief.

 

Своей статьей Вы затронули базовую проблему построения торговых систем - подбор исходных данных для моделей. По своей трудоемкости - это не менее половины времени, а то все 75%.  Даже в том виде, как это сделали Вы - это очень важно для понимания базовых проблем трейдинга.

 
faa1947:

 ...Не могу с Вами согласиться в принципе. ...

Ну хорошо, не соглашайтесь. Пока других подходов не найдено, предлагаю использовать этот ))) 

Причина обращения: