Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 595

 
СанСаныч Фоменко:

Когда входишь в здание под названием "Статистика", то над входом написано "Мусор на входе - мусор на выходе".




Любой индикатор это функция от цены. Нейронные сети обладают неленейностью. Она сама способна вывести формулу любого индикатора, если сеть достаточной глубины. Если сеть не может обучиться на ценовых данных, то дело не во входах, а в том что по цене в принципе нельзя получить выходные данные.

 
Grigoriy Chaunin:

Любой индикатор это функция от цены. Нейронные сети обладают неленейностью. Она сама способна вывести формулу любого индикатора, если сеть достаточной глубины. Если сеть не может обучиться на ценовых данных, то дело не во входах, а в том что по цене в принципе нельзя получить выходные данные.

И вы, и СанСаныч - вы оба правы.

С одной стороны, НС сама построит любой нужный ей индикатор и их совокупность. С другой, если данные неочищенные, и в них слишком много шума, то никакая НС не сможет ничему обучиться. Т.е., дело и во входах тоже.

 

Насколько важно перемешивать выборку при обучении НС? какие математические обоснования этому есть?

перемешивание актуально для всех моделей МО или только для каких-то конкретных?

 
Maxim Dmitrievsky:

Насколько важно перемешивать выборку при обучении НС? какие математические обоснования этому есть?

перемешивание актуально для всех моделей МО или только для каких-то конкретных?

Перемешивать нужно, чтобы алгоритм обучения при каждом цикле не шел одним и тем же путем. Можем попасть и не выбраться из локального экстремума. Однако перемешивание тоже не панацея.
 
Yuriy Asaulenko:
Перемешивать нужно, чтобы алгоритм обучения при каждом цикле не шел одним и тем же путем. Можем попасть и не выбраться из локального экстремума.

т.е. нужно несколько раз перемешать, несколько раз обучить и посмотреть как соотносятся результаты?

 
Maxim Dmitrievsky:

т.е. нужно несколько раз перемешать, несколько раз обучить и посмотреть как соотносятся результаты?

Перемешивать нужно после каждых нескольких эпох обучения. К сожалению, многие алгоритмы обучения не допускают перерывов (см. Питон - некоторые пакеты (модули)) и начинают каждый раз с нуля.

Перемешивание также хорошо сочетать с отжигом. Но, опять таки, на автомате это делать трудно. Т.к. нужно всегда смотреть промежуточные результаты, а потом уже планировать дальнейшие действия.

 
Yuriy Asaulenko:

Перемешивать нужно после каждых нескольких эпох обучения. К сожалению, многие алгоритмы обучения не допускают перерывов (см. Питон - некоторые пакеты (модули)) и начинают каждый раз с нуля.

Перемешивание также хорошо сочетать с отжигом. Но, опять таки, на автомате это делать трудно. Т.к. нужно всегда смотреть промежуточные результаты, а потом уже планировать дальнейшие действия.


уу.. вон оно че.. т.е. просто перемешать перед обучением не имеет никакого смысла

 
Alexander_K2:Я знаю людей которые из НС вытянули грааль, но те парни настолько закрыты для общения и даже намёков о том что они делают, у меня новичка так точно нет шансов. Знаю только что там всё архисложно, там не велс, не метатрейдер и даже не S#, а С++ и MatLab с какими то фичами которым расшифровывают и интерпретируют данные поступающие с калайдеров, оказалось что это одна и та же методология, я как услышал так и подафигел, там с ними работает дядя который раньше в ЦЕРНе перемалывал терабайты в день ища новый частицы в квантовом хаосе."

И у тебя теперь есть) Погремуха - CatBoost.
---------
Если возникнет желание половить бозончик...
https://www.kaggle.com/c/higgs-boson

Higgs Boson Machine Learning Challenge
Higgs Boson Machine Learning Challenge
  • www.kaggle.com
Use the ATLAS experiment to identify the Higgs boson
 

В Darch по умолчанию стоит перемешивание перед каждой эпохой. Пробовал отключить - вообще ни чему не обучилась.

Я вот и подумал, если все перемешивается, то как сделать, чтобы свежие данные сильнее влияли на обучение?

 
elibrarius:

В Darch по умолчанию стоит перемешивание перед каждой эпохой. Пробовал отключить - вообще ни чему не обучилась.

Я вот и подумал, если все перемешивается, то как сделать, чтобы свежие данные сильнее влияли на обучение?

Пробуйте кросс-валидацию (K-fold).
Причина обращения: