Предсказание рынка на основе макроэкономических показателей - страница 58

 

Более наглядная картинка:


 
Vladimir:

Повторюсь: мой метод не прогнозирует S&P500. Он прогнозирует рецессии. Рецессия 2020 года пока не закончилась. Проблем с прогнозом нет.

...

За конструктивный диалог. Замечу все же, что в первой строчке первого поста этой темы, черным по белому поставлена задача исследования: прогнозировать S&P500. Далее, речь идет о предсказании след.квартала и пошагово описывается подход к построению исследования. О рецессии говориться всколзь (точнее, вообще не говориться).

Конечно, не важно что именно предсказывается, важно что б сбылось.)
 
Vladimir:

1. Предсказатели выбираются по их способности предсказывать рецессии. Выбор производится автоматически, без моего влияния и мнения.

2. Шкала оценки это насколько предлагаемая buy&sell стратегия более доходнее чем buy&hold

3. Исторические участки ограничены глубиной истории индивидуальных экономических показателей

Единственная возможная критика это то что результаты по истории не гарантируют точность предсказний рецессий в будущем. Все результаты показанного графика были подогнаны под историю кроме последнего сигнала о рецессии в декабре 2019 года.

Для конструктивного диалога предлагаю сравнить точность моей системы / модели с другими фундаментальными или течническими системами предсказания рецессий. Можно также сравнить доходность + drawdown моей системы с другими системами торгующими по S&P500.

Подчеркну: мои аргументы отталкиваются от содержания первого поста темы, где описан метод прогнозирования S&P500. Другие посты этой темы мог пропустить и их не рассматриваю вовсе, считая что метод полность представлен на первой странице.

1. Вот этого не нашел в первом посте. Описываемый метод прогнозирования направлен на предсказание след.квартала S&P500. О методе предсказания рецессии ничего не прочел. Если метод предсказания рецессии отличается от описанного, пожалуйста изложите его (или дайте ссылку) чтобы можно было получить представление.

Также, если можно, чуть подробнее опишите способ автоматического выбора показателей так,  что полностью исключается фактор субьективности. 

2. Вот этот пункт не понял. В описании метода прогнозирования не говориться о конкретных стратегиях. (Точнее, сам метод и есть стратегия, но он специально не именуется).

3. То есть, берется полная глубина истории каждого показателя без укорачивания?

...

Согласен сравнить точность Вашей системы предсказания рецессий с другими, только откуда их взять?
 

Спрошу просто: предсказала ли Ваша система предсказания рецессий эту рецессию и за какой срок до нее?

https://www.google.com/amp/s/ria.ru/amp/20200616/1572964400.html

Глубочайший спад: в США официально объявили о начале рецессии
Глубочайший спад: в США официально объявили о начале рецессии
  • 2020.06.16
  • Alexey Markun
  • ria.ru
МОСКВА, 16 июн — РИА Новости, Наталья Дембинская. С февраля американская экономика погрузилась в рецессию — впервые за 13 лет. Сокращение производства и рост безработицы просто катастрофические. Аналитики предупреждают: нынешний кризис, возможно, окажется даже хуже глобального финансового краха 2007-2009 годов.Скатились в рецессиюО том, что...
 
Реter Konow:

Спрошу просто: предсказала ли Ваша система предсказания рецессий эту рецессию и за какой срок до нее?

https://www.google.com/amp/s/ria.ru/amp/20200616/1572964400.html

Вы хоть перед своими комментариями-простынями читаете то, что комментируете?

Владимир же написал "Данная стратегия дала сигнал на продажу в декабре 2019. Пока сигнал на покупку не даёт. Видимо рынок пойдёт вниз." (с).

 
Vladimir:

Итак, задача предсказать S&P 500 индекс на основе имеющихся экономических показателей.

Шаг 1: Находим показатели. Показатели имеются в общем доступе здесь: http://research.stlouisfed.org/fred2/ Их там 240 тысяч. Самым главным является рост GDP. Этот показатель расчитывается каждый квартал. Отсюда наш шаг - 3 месяца. Все индикаторы на более коротком периоде перерасчитываются на 3-х месячный период, остальные (годовые) отбрасываются. Отбрасываем также показатели для всех стран кроме США и показатели, у которых нет глубокой истории (по крайней мере 15 лет). Итак кропотливым трудом отсеиваем кучу показателей и получаем порядка 10 тыс показателей. Формулируем более конкретную задачу прдесказать S&P 500 индекс на один или два квартала вперёд имея в наличии 10 тыс экономических показателей с квартальным периодом. Я делаю всё в МатЛабе, хотя можно и в R.

Шаг 2: Преобразуем все данные к стационарному виду путём дифференцирования и нормирования. Методов тут много. Главное чтобы из преобразованных данных можно было восстановить первоначальные данные. Без стационарности не одна модель работать не будет. S&P 500 ряд до и после преобразования показан внизу.

 

Шаг 3: Выбираем модель. Можно нейронную сеть. Можно много-переменную линейную регрессию. Можно много-переменную полиномную регрессию. После опробования линейных и нелинейных моделей приходим к выводу что данные настолько зашумлены что вписывать нелинейную модель смысла нет т.к. y(x) граф, где y = S&P 500 и x = один из 10 тыс показателей, бредставляет собой почти круглое облако. Таким образом формулируем задачу ещё более конкретно: предсказать S&P 500 индекс на один или два квартала вперёд имея в наличии 10 тыс экономических показателей с квартальным периодом используя много-переменную линейную регрессию.

Шаг 4: Выбираем из 10 тыс экономических показателей наиболее главные (уменьшаем размерность задачи). Это самый главный и трудный шаг. Допустим берём историю S&P 500 длинной в 30 лет (120 кварталов). Чтобы представить S&P 500 в виде линейной комбинации экономических показателй разного рода, достаточно иметь 120 показателей чтобы точно описать S&P 500 за эти 30 лет. Причём показатели могут быть совершенно любыми чтобы создать такую точную модель из 120 показателей и 120 значений S&P 500. Значит нужно уменьшать количество входов ниже количества описываемых значений функции. Например ищем 10-20 наиболее важных показателей-входов. Такие задачи описания данных небольшим количеством входов, выбранных из огромного количества кандидатов-базисов (словаря), называются разряжённым кодированием (sparse coding).

Методов отбора входов-предсказателей много. Я перепробовал их все. Вот главные два:

  1. Классифицируем все 10 тыс данных по их предсказауемой способности S&P 500. Предсказуемая способность может измеряться коэффициентом кореляции или взаимной информацией.
  2. Перебираем все 10 тыс показателей по дному и выбираем тот, который дал линейную модель y_mod = a + b*x1 описывающую S&P 500 с наименьшей ошибкой. Потом выбираем второй вход опять же перебором оставшихся 10 тыс -1 индикаторов таким образом чтобы он описал остаток y - y_mod = c + d*x2 с наименьшей ошибкой. И так далее. Такой метод называется stepwise regression или matching pursuit. 

Вот первые 10 индикаторов с максимальным коэффициентом корреляции с S&P 500:

Series ID Lag Corr Mut Info
'PPICRM' 2 0.315 0.102
'CWUR0000SEHE' 2 0.283 0.122
'CES1021000001' 1 0.263 0.095
'B115RC1Q027SBEA' 2 0.262 0.102
'CES1000000034' 1 0.261 0.105
'A371RD3Q086SBEA' 2 0.260 0.085
'B115RC1Q027SBEA' 1 0.256 0.102
'CUUR0000SAF111' 1 0.252 0.117
'CUUR0000SEHE' 2 0.251 0.098
'USMINE' 1 0.250 0.102

Вот первые 10 индикаторов с максимальной взаимной информацией с S&P 500:

Series ID Lag Corr Mut Info
'CPILEGSL' 3 0.061 0.136
'B701RC1Q027SBEA' 3 0.038 0.136
'CUSR0000SAS' 3 0.043 0.134
'GDPPOT' 3 0.003 0.134
'NGDPPOT' 5 0.102 0.134
'OTHSEC' 4 0.168 0.133
'LNU01300060' 3 0.046 0.132
'LRAC25TTUSM156N' 3 0.046 0.132
'LRAC25TTUSQ156N' 3 0.046 0.131
'CUSR0000SAS' 1 0.130 0.131

 

Lag это задержка входного ряда по отношению к моделируемому ряду S&P 500. Как видно из этих таблиц, разные методы выбора наиважнейших входов приводят к разным наборам входов. Так как моей конечной целью является минимизация ошибки модели, то я выбрал второй метод выбора входов, т.е. перебор всех входов и выбор того входа который дал наименьшую ошибку.

...

К вопросу о существовании и влиянии незаметного субьективного фактора на исследование, предлагаю внимательно перечитать эти шаги и убедится, что субьективность в них либо отсутствует, либо НЕ меняет конечный результат.

Примите во внимание, что исключенные (в шаге 4) из анализа показатели, в сумме, могли иметь веса дающие обратный результат, если бы Вы их все учли. Т.е. этого мы знать ведь не можем, верно?
 
denis.eremin:

Вы хоть перед своими комментариями-простынями читаете то, что комментируете?

Владимир же написал "Данная стратегия дала сигнал на продажу в декабре 2019. Пока сигнал на покупку не даёт. Видимо рынок пойдёт вниз." (с).

Читаю с телефона, мог пропустить. 

Да, на 55-ой странице. Мой первый пост на 56-ой. Читал первую, на которой изложена суть метода прогнозирования и остальное пропустил, т.к. интересует именно суть. Если она (суть) поменялась за эти годы (возможно, потому что Владимир стал говорить о рецессии, о которой ничего нет в первом посте), то я говорю именно о методе первого поста.
 
О какой рецессии в штатах может идти речь, если они печатают мировую валюту, за нее покупают всё в мире и обратно в виде долга возвращают её назад. В остальном мире не остаётся ни продуктов производства ни валюты. На этом балагане внутренние средства производства в штатах растут в цене. Население не страдает т.к. покупательская способность поддерживается печатным станком. Инфляция выносится за пределы страны. Сбережения в долларах в остальном мире стремятся обратно пропорционально к индексу  S&P 500.  
 
Реter Konow:
К вопросу о существовании и влиянии незаметного субьективного фактора на исследование, предлагаю внимательно перечитать эти шаги и убедится, что субьективность в них либо отсутствует, либо НЕ меняет конечный результат...
Будь моим оппонентом в этом теме какой нибудь "прошаренный" философ, он бы, поняв что я загнал его в ловушку вопросом субьективности "обьективного" исследования, от которой невозможно никак откреститься ни при каких вариантах, задал бы мне встречный вопрос - "а как вы себе представляете абсолюно обьективное исследование?", на что я был бы вынужден ответить, что такого варианта я вообще не представляю, ведь условия ЛЮБОГО исследования задаются выстроенной концепцией исследователя и от этого фактора не уйти. В итоге, мы вместе бы пришли к выводу, что в прогнозировании ставку нужно делать не столько на сам метод анализа данных, сколько на личностную субьективность которая может быть права вопреки всем "обьективным" показателям в исследовании.

Делайте ставку на Личность в первую очередь и на рассматриваемые в анализе показатели во вторую, ведь правота может быть инвариантна и научно необьяснима. Такие личности были и будут в истории.
 
Реter Konow:
... В итоге, мы вместе бы пришли к выводу, что в прогнозировании ставку нужно делать не столько на сам метод анализа данных, сколько на личностную субьективность которая может быть права вопреки всем "обьективным" показателям в исследовании.

Делайте ставку на Личность в первую очередь и на рассматриваемые в анализе показатели во вторую, ведь правота может быть инвариантна и научно необьяснима. Такие личности были и будут в истории.
Тут внесу уточнение, чтобы читатель не подумал, что я веду его к мистике (ну может, самую малость).

И так:

Личностная субьективность в анализе/исследовании должна быть локализована и четко ограничена рамками. Мы должны ясно понимать, в чем именно и почему мы вынуждены принимать субьективные допущения. Должны ответить на вопрос почему эту долю умозрительности готовы принять. При этом, наш анализ/исследование все равно должны стремится к максимальной обьективности, экспериментальной подтвержденности, фактах и проверках, НО, раз субьективность все равно неискоренима, нужно выработать критерии, указывающие, что на нее можно положиться. 


Это значит (образно), в каждом исследование/анализе, в числовых рядах, формулах и моделях добавлять параметр "я так думаю" и считать вместе с ним. Будет точнее.
Причина обращения: