Группировка листьев - требуются мысли и идеи - страница 5

 
Vladimir Perervenko:

Как то Вы застряли в лесу. Если не идет, выйдите из темы, поработайте в другом направлении, потом вернетесь(может быть) с новыми идеями. Коль скоро Ваш интерес в лесу, попробуйте вместо деревьев использовать другие модели. Простые и быстрые. Например elm, есть несколько пакетов, самый быстрый elmNNRcpp. Конечно есть и другие реализации. Пакет для создания ансамбля состоящего из любых моделей, не только деревьев) - gensemble.

Удачи

Разве я говорил, что нет результатов - напротив, результат очень не плохой и нужно его дальше развивать. И, Вы не поняли - я не использую леса, а использую именно отобранные листья.

Конечно, я знаю о разных методах построения моделей, но все они мало пригодны для рынка, поэтому и приходится изобретать свой велосипед.

Но, я не против, если Вы согласитесь со мной поработать и проверить мои предикторы на других моделях, в чем у Вас значительно больше опыта!

 
Aleksey Vyazmikin:

Пока, к сожалению, методика иная - гипотеза, её проверка и выводы. И тут самое опасное как раз кроется в выводах - они могут быть ошибочны, а именно на них строятся дальнейшие идеи/гипотезы, и даже небольшая ошибка в выводах может привести к ошибке, распространившейся на несколько поколений развития проекта.

Поэтому, публичное обсуждение не только самой гипотезы, но и выводов очень полезны для меня.

Спи. 

 
Алексей Тарабанов:

Спи. 

А Вы грубы, сударь!

 
Хотелось бы несколько уточнений... 

1. Лист - это нейрон или целое дерево? 
2. Что является листом - некая фича, например, последнее значение машки
3. Если обучение происходит в R, а все остальное - в MQL, как определяется, какой лист был активирован, а какой - нет? 
4. Зачем группировать "листья" - сформировать "вероятность" прогноза по определенной фиче поданной на вход? То есть, идея не в самом прогнозе, а в поиске значимых фич? 
5. После того, как отобраны "листья", что происходит дальше - из них создается дерево, которое уже принимает торговое решение? 
 
...:
Хотелось бы несколько уточнений... 

1. Лист - это нейрон или целое дерево? 
2. Что является листом - некая фича, например, последнее значение машки? 
3. Если обучение происходит в R, а все остальное - в MQL, как определяется, какой лист был активирован, а какой - нет? 
4. Зачем группировать "листья" - сформировать "вероятность" прогноза по определенной фиче поданной на вход? То есть, идея не в самом прогнозе, а в поиске значимых фич? 
5. После того, как отобраны "листья", что происходит дальше - из них создается дерево, которое уже принимает торговое решение? 

Лист - это лист дерева в обычном его понимании в машинном обучении, т.е. дерево имеет много разных листов, которые ветвятся через сплиты от его коренного предиктора. Само дерево записывается примерно таким выражением у меня:

if(A>=2.5 && B<0 && C>=6.5) arr_Buy[X++]=1;

Где A, B, C - это предикторы, предварительно посчитанные.

Предиктором может быть и МАшка, но это весьма примитивно - лучше описывать положение цены относительно МАшки, в том числе и в разных точках.

Как активируются листы показал выше, в настоящий момент есть сигнальный лист и 4 к нему листьев-фильтров, которые обнуляют сигнал в массиве. Фильтры так же как и листья проходят отбор на выборке разбитой по годам - 6 фолдов.

Группировка листьев позволяет сделать оценку события более объективной. Если у нас схожие листья, то они не могут расцениваться, как независимые эксперты при голосовании, что происходит в ансамблях деревьев. Лист описывает часть события, которое статистически влияет на дальнейший исход, и чем больше разных событий будет выявлено в момент оценки, тем больше вероятность положительного исхода (верной классификации), и тем большей суммой можно рискнуть (в моем случае на каждую группу дается 1 лот).

После того, как отобраны листья и фильтры для них происходит группировка листьев.

Листья и группы из них ещё можно дальше воспринимать как предикторы и обучать другие модели, в том числе повторить весь цикл - положительный эффект имеется.

Минус в том, что данный метод очень ресурсозатратный - слишком долго происходит создание листьев, и чуть меньше времени уходит на их отбор.

Причина обращения: