Анализ данных и построение моделей для прогнозирования экономических показателей

Дмитрий 2016.03.10 16:16 #401

Sergiy Podolyak:

Это в каком смысле? Я предсказал мировой кризис, ещё в 2007-м году.

Все "предсказания" в этой жизни НИЧЕГО не стоят - стоят что-то лишь деньги.

Ты заработал миллион на этом предсказании?

Во всем мире миллионы человек что-то "предсказывали" - заработали единицы.

Был уверен - надо было закладывать квартиру и открываться на все.

[Удален] 2016.03.10 16:26 #402

Дмитрий:

Все "предсказания" в этой жизни НИЧЕГО не стоят - стоят что-то лишь деньги.

Ты заработал миллион на этом предсказании?

Во всем мире миллионы человек что-то "предсказывали" - заработали единицы.

Был уверен - надо было закладывать квартиру и открываться на все.

Казачок, от твоей алчности так и прёт на километр Goldman Sachs - ом. Ты хоть бы маскировался как-то, что - ли.....

Не всё измеряется деньгами. Ты сможешь понять это только став экономистом или трейдером.

FOREX - Тенденции, прогнозы [АРХИВ] FOREX - Тенденции, Тренд и уровни

Дмитрий 2016.03.10 16:29 #403

Sergiy Podolyak:

Казачок, от твоей алчности так и прёт на километр Goldman Sachs - ом. Ты хоть бы маскировался как-то, что - ли.....

Не всё измеряется деньгами. Ты сможешь понять это только став экономистом или трейдером.

)))

нельзя быть ТРЕЙДЕРОМ, не измеряя все деньгами!

Экономистом - можно, а трейдером - нет.

И если бы ты открылся на все в 2007, то вылетел бы по коле моржовому до осени 2008-го

Дмитрий 2016.03.10 16:29 #404

)))) надо заехать на Ломоносова и надавать Черняку по ушам - кого он учил......

Vizard_ 2016.03.10 21:52 #405

Vladimir: В остальных столбцах это разные экономические предсказатели. GDP находится в 1166 столбце.......

Данные мягко говоря не ахти. + Лишнего понапихано)))
Повыкидывать-
GDP = 144.1876*COL83
GDP = COL226
GDP = COL739
GDP = 62 + COL1128
GDP = 0.001*COL1168
и т.д...
(COL83 = столбец 83)
Особо не ковырял(меньше чем матлаб искал)))
Экспорт из матлаба с разделителями ; = dlmwrite('myfile',Data,';')
С наскока две модельки на 1 набл. вперед(кр. и зел.).

Правая часть от вертикальной линии = применение моделек к новым данным...

Машинное обучение в трейдинге: Metatrader платформа 5 Советники: Trade-Arbitrage

Vladimir 2016.03.10 23:43 #406

Vizard_:
Данные мягко говоря не ахти. + Лишнего понапихано)))
Повыкидывать-
GDP = 144.1876*COL83
GDP = COL226
GDP = COL739
GDP = 62 + COL1128
GDP = 0.001*COL1168
и т.д...
(COL83 = столбец 83)
Особо не ковырял(меньше чем матлаб искал)))
Экспорт из матлаба с разделителями ; = dlmwrite('myfile',Data,';')
С наскока две модельки на 1 набл. вперед(кр. и зел.).

Правая часть от вертикальной линии = применение моделек к новым данным...

Неплохо для начала. Какому году соответсвует вертикальная линия? И сколько предикторов в моделях?

Mykola Demko 2016.03.11 14:52 #407

Vladimir:

Ну вот, весна, медведь проснулся, голодный ...

Показать что ли как S&P500 упало в 2008 году во время отрицательного роста GDP или сами посмотрите?

Пойдите в начало ветки и почитайте о моих целях - предсказание крахов и избежание лонг позиций перед наступлением таковых. Меня трейдинг не интересует, поэтому использую квартальные данные. Главное это сохранение капитала. А как там S&P500 колеблется около своих трендов и флэтов это меня не интересует.

>> Избавьтесь от этого радиотехнического высокомерия- считать всех экономистов идиотами... С чего Вы взяли, что только Вы читаете эти тысячи экономических показателей ? Они ТОЖЕ их читают.

Ну всех идиотами не считаю, но большинство - да, постулируют уже свершившееся, или постоянно предсказывают рецессию пока она не произойдёт, а потом объявляют себя гениями. Пока не один экономист не предсказал крах 2008 года, поэтому, да, идиоты за исключением пары. Фед банк использует свою SDGE модель с 16-ю общепринятыми показателями для предсказания экономики, а эта модель туфта. А вы о такой моделе наверно даже не слышали.

Причём тут радиотехника и корелляция. Радиотехническими методами не пользуюсь, но вреда в них тоже не вижу. Как раз выасокомерие прёт от вас, в том смысле что не допускаете наличие методов анализа и создание моделей отличных от общепринятых в экономике. Игнорирование прогресса моделирования и машинного обучения в других отраслях науки это и есть высокомерие, или даже тупость, не позволяющая делать новые открытия.

Всё верно, на переднем крае нет ни каких авторитетов. Авторитетам респект и уважуха, а думать нужно своей головой, и во всём сомневаться, даже если уверен, процентик сомнения всё равно оставь, а вдруг этот процентик потом выведет из тупика.

Порадовал мем "во время отрицательного роста GDP" :))))

Брать кредит? Да-да, для [Архив]учитесь зарабатывать селяне![Архив] Сбрасывание цифры под авой.

Vizard_ 2016.03.11 15:35 #408

Vladimir:
Неплохо для начала. Какому году соответсвует вертикальная линия? И сколько предикторов в моделях?

Плохо. Глянул ради любопытства и сразу все удалил. В данных нет нормальных предикторов на мой взгляд. Вроде четыре первых строки обрезал, полно пустых значений было.
Модельки строил на 100 первых наблюдениях. Получается 104, а со 105 уже ООS. Зеленая - совсем простая, 6-7 предикторов без преобразований. Красная - в два раза больше
+ чуть поизгалялся, брал и абсолютные значения и синусы и пр., ну на ООS это и видно, штормить начало))) В обоих(для устойчивости) - нет коэффициентов, лишь простые формулы
между используемыми предикторами. Не нормализовал, к первым разностям(приращениям) потом привел для того чтоб наглядней было видно где косячит. Наблюдений мало, тут надо
модель делать чтоб какой то "физический смысл" мало-мальски был. Типа - безработица и(или) бла-бла-бла, их взаимосвязь... ну и т.д. Попытался, не получилось))) Если с ретрейном на
каждом наблюдении(квартале) как ты делаешь, вообще без разницы что на вход подавать, лишь бы рез был. Насколько понял сетка у тебя сама отбирает, тем не менее данные
предварительно все же лучше очистить...

Машинное обучение в трейдинге: Есть ли закономерность в Нужна помощь в создании

Vladimir 2016.03.11 18:27 #409

Мой матлабовский код сначала удаляет предикторы в которых есть NaN в моделируемой истории, потом преобразует все данные одним и тем же методом, потом пробегает по всей истории пробуя каждый из 2-х тысяч предсказателей и их задержанных версий на предскательные возможности прошлого будущего, расчитыавет накоплённую ошибку предсказаний каждым предсказателем и в конце выдаёт список предсказателей сортированный по их ошибке. Если такое делать для каждого прошлого момента истории и брать лучшие предсказатели и предсказывать будущее, то результат довольно приличный на протяжении несколько лет пока не случится рецессия (падение GDP). В такие моменты прошлые лучшие предсказатели плохо предсказывают падение GDP и в заменяются на новые предсказатели. И так профолжается до новой рецессии. Есть ли универсальная формула зависимости GDP от каких-то ключевых предсказателей мне пока неизвестно. Если добавить ещё сто лет истории то в конце этих ста лет мы будем иметь список предсказателей которые более менее хорошо предсказали все рецессии, но при наступлении следующей рецессии могут опять заменится на новые предсказатели.

Интуитивно выбирать предсказатели тоже ошибочно. Например, уровень безработицы это лидирующий или лаговый предсказатель? Вызывает ли высокий уровень безработицы рецессию или наоборот вызывает ли рецессия высокий уровень безработицы? Мне так кажется что рецессия вызывает высокий уровень безработицы поэтому использовать безработицу для предсказаний рецессий нельзя. Но решение об использование каких-то предсказателей в моделе делается моим кодом на основании накопленных ошибок предсказаний. Пока лидирующее место в моей моделе занимают предсказатели на основе частных инвестиций на постройку домов и на бытовое потребление. Это наверно логично так как дома и бытовое оборудование это большая часть GDP. Если народ не покупает дома, холодильники и телевизоры то их производство падает, падает GDP, фабрики увольняют работников, безработица растёт, потребление ещё больше падает. Республиканцы и демократы выводят страну из рецессии разными способами. Демократы дают деньги низко-оплачиваему слою населению (ваучеры) чтобы увеличить их потребление или поощрают иммиграцию для создания нового строя потребетилей. Республиканцы утверждают что одноразовые $500-700 пособие бедным семьям не позволит им купить новый дом или машину и двинуть экономику вперёд. Они предпочитают давать деньги боратым путём понижения налогов, особенно на инвестиции. Их теория в том что богатые, сохранив больше денег на меньших налогах, будут покупать дорогие предметы (дома, машины и прочее), что увеличит потребление где это важно, или они будут инвестировать эти деньги на бизнесс, что приведёт к понижению безработицы, увеличению платёжеспособности населения и увеличению потребления. Вся Рейганомика была основана на этом.

Форвард хуже бэктеста - Оценка вероятностного предсказателя Bayesian regression - Делал

Stanislav Korotky 2016.03.12 20:44 #410

Vladimir:

1. Расчитать относительные скорости: r[i] = x[i]/x[i-1]-1. Такое преобразование автоматически нормализует данные, заглядывания в будущее нет, больше ничего делать не нужно. Но большая проблема существует с нулевыми данными (x[i-1]=0) и отрицательными данными, а таких в экономических показателях много.

2. Расчитать приращения d[i] = x[i] - x[i-1]. Такому преобразованию пофигу нулевые и отрицательные данные, но приращения растут по времени для экспоненциально растущих данных как например годовой валовый продукт. Т.е. дисперсия не постоянна. Например, построить зависимость приращений ГВП от уровня безработицы нельзя так уровень безработицы колеблется в диапазоне с неизменной дисперсией, а ГВП растёт экспоненциально, с экспоненциально растущей дисперсией. Значит приращения нужно нормализовывать на изменяющуюся по времени дисперсию. Но расчитать последнюю это не так и просто.

3. Убрать из данных тренд, расчитанный например фильтром Ходрика-Прескота, а высокочастотный остаток нормализовать изменяющейся по времени дисперсией и использовать как вход модели. Проблема здесь в том что фильтр Ходрика-Прескота и другие фильтры основанные на подгонке полиномов (Savitzky-Golay filter, lowess, и т.п.) загляд.вают в будущее. Мувинг отстаёт от данных и непригоден для убирания тренда, особенно на экспоненциально растущих данных.

Другие идеи есть?

Я использую (x[i] - x[i-1]) / (x[i] + x[i-1]). Отрицательные данные ничем не хуже положительных. Нормализация в [-1, +1] имхо лучше, чем в [0, 1].

Предсказание рынка на основе макроэкономических показателей - страница 41