Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 1620

 
mytarmailS:

ну по ходу да.. но можно и поекспериментировать

И какой алгоритм выбрать, что бы получить приемлемый результат без рандома и с разумным сроком расчета? Я не очень силен в кластеризации.

 
Aleksey Vyazmikin:

Я изучал CatBoost, поэтому буду говорить про него.

Глубина дерева рекомендована 4-6 сплита. Такую глубину и пробую в целом.

Деление предиктора происходит тремя разными алгоритмами на выбор. Создается так называемая сетка.

Результаты разделения и самому интересно вытащить и увидеть. А что АлгЛиб делит на равные части предикторы при построении дерева для леса?

Алглиб делит пришедший кусок по медиане (поправка - не по середине, а по медиане. ). Т.е. если пришло 100 примеров, то сортирует значения и делит по значению из 50-го примера. В коде заложен вариант по квантилям, но не используется.

Про XGBoost вспомнил, что там есть вариант рандомного деления. В катбусте вроде тоже.

А вообще странно, что рекомендуют такие неглубокие деревья.
Как я уже писал, при таком неглубоком дереве вряд ли будет выбран сектор, например с 20 до 30% от значения. В лучшем случае 1 или 2 раза поделит по медианам или по случайным значениям в Бустах.
Если бы глубина была 100, то вполне могли бы дойти до сектора 20-30% по какому-либо предиктору.

Предполагаю, что в бустах это компенсируется большим числом уточняющих деревьев, которые могут использовать другие предикторы, которые не использовались в главном дереве, но и они тоже будут всего 1 -2  раза разделены.

 
Aleksey Vyazmikin:

И какой алгоритм выбрать, что бы получить приемлемый результат без рандома и с разумным сроком расчета? Я не очень силен в кластеризации.

Да в прицепе можно любую (knn,som,dtwclust...), лучший вариант конечно покажет эксперимент ...

Поймите меня правильно, я не использую то о чем писал, я просто прочитал вашу идею и посмотрел на нее немного с другой стороны реализации, ну и высказался... те я не гарантирую никакого результата 

 
elibrarius:

Алглиб делит пришедший кусок по медиане. Т.е. если пришло 100 примеров, то сортирует значения и делит по значению из 50-го примера. В коде заложен вариант по квантилям, но не используется.

Про XGBoost вспомнил, что там есть вариант рандомного деления. В катбусте вроде тоже.

А вообще странно, что рекомендуют такие неглубокие деревья.
Как я уже писал, при таком неглубоком дереве вряд ли будет выбран сектор, например с 20 до 30% от значения. В лучшем случае 1 или 2 раза поделит по медианам или по случайным значениям в Бустах.
Если бы глубина была 100, то вполне могли бы дойти до сектора 20-30% по какому-либо предиктору.

Предполагаю, что в бустах это компенсируется большим числом уточняющих деревьев, которые могут использовать другие предикторы, которые не использовались в главном дереве.

Реальность может быть не той, что мы представляем - нужно попробовать воспроизвести алгоритмы разделения из CatBoost и посмотреть, что там реально происходит и на сколько корректно.

Относительно рандома - там есть рандом по выбору участка разбивки сетки предиктора, типа не самый лучший берем, а случайный, если я правильно понимаю. И, есть алгоритмы, которые делают стеку неравномерным делением по диапазонам.

 
mytarmailS:

Да в прицепе можно любую (knn,som,dtwclust...), лучший вариант конечно покажет эксперимент ...

Поймите меня правильно, я не использую то о чем писал, я просто прочитал вашу идею и посмотрел на нее немного с другой стороны реализации, ну и высказался... те я не гарантирую никакого результата 

Разве я говорю о гарантиях - просто интересно понять Вашу идею.

 


Почти готов индикатор Neuro )) Это советник, чисто индикатор не хватило квалификации.
 
Оранжевая зона вверху - предсказывает движение вниз, зеленая внизу - движение вверх, толщина степень уверенности нейросети. Работает только на BTCUSD M1 (пока...).
Круто? ))
 
Evgeny Dyuka:
Оранжевая зона вверху - предсказывает движение вниз, зеленая внизу - движение вверх, толщина степень уверенности нейросети. Работает только на BTCUSD M1 (пока...).
Круто? ))

Я бы сказал неплохо, но расстраивает это

По сути работает как обычный индикатор в зоне перекуплености/перепроданости

иногда угадывает иногда нет, так быть не должно.. 

Вы вообще тестировали эту сеть на предмет торговли? Мне опыт   подсказывает что она не будет зарабатывать..

Разве что фильтр поставить на "увереность" сети

 
Aleksey Vyazmikin:

Реальность может быть не той, что мы представляем - нужно попробовать воспроизвести алгоритмы разделения из CatBoost и посмотреть, что там реально происходит и на сколько корректно.

Относительно рандома - там есть рандом по выбору участка разбивки сетки предиктора, типа не самый лучший берем, а случайный, если я правильно понимаю. И, есть алгоритмы, которые делают стеку неравномерным делением по диапазонам.

Я думаю по другому. Каждый предиктор разделяется по случайной точке, но выбирается все равно лучшее получившееся разделение.

 
mytarmailS:

Я бы сказал неплохо, но расстраивает это

По сути работает как обычный индикатор в зоне перекуплености/перепроданости

иногда угадывает иногда нет, так быть не должно.. 

Вы вообще тестировали эту сеть на предмет торговли? Мне опыт   подсказывает что она не будет зарабатывать..

Разве что фильтр поставить на "увереность" сети

Спорить не буду по поводу адекватности/неадекватности, за ночь подкопилась статистика + добавил фильтр "уверенности". Так выглядит ночь с задранным высоко фильтром. Если поставить ноль, то линии вообще прерываться не будут, только менять сторону.
В ближайшее время дам для тестирования.

Причина обращения: