Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 1017

 

Почему все зациклились на фичах?

Я пробовал 1000 и 200 фич - разница очень мала в предсказаниях. Гораздо значительная разница в методе дампа данных. Между попыткой предсказать полный 1 бар и 0.5 бара очень большая разница, чем сокращение 1000 фич до 200.

 

Женя:

К сожалению секретность тут основное требование))) Идет речь о протоколе обмена обфусцированными С++ моделями принимающими на вход сырые данные с биржи а выдающие прогнозы, чтобы можно было взять такую с описанием её входов и выходов, поюзать к примеру месяц или на сколько она рассчитана без модификаций(дообучение и тп.) и сделать выводы(покупать, арендовать и тд)

Наверное это и есть один из лучших вариантов - представлять модель в виде исполнимого приложения, можно консольного, принимающего данные по stdin или файлы csv с командной строки т.к. этот вариант м.б. легко, без заморочек использован и защищен, посредством обфускации по времени и.т.д.

 
Dr. Trader:

numerai, да.

Их способ не лишён смысла. Я пробовал своими моделями предсказывать сотни тысяч рандомных инпутов. Потом для прогноза "чёрным ящиком" - искал самую близкую по координатам точку, и её результат использовал как сам прогноз. Такой прототип сработал, но для реала можно и улучшить - найти 3 самые близкие точки, и какой-нибудь триангуляцией найти средний результат. Но это расчётозатратно, даже с opencl видюхой может уйти пара секунд на прогноз.

Согласен,  сеэмплирование модели в облако точек - простой но действенный метод "запекания" модели классификации\регрессии, кстати есть модели ближайшего соседа которые шустро ищут, n*log(n) вместо n^2, как деревья, где то видел на плюсах в сети

 
Ivan Negreshniy:

Наверное это и есть один из лучших вариантов - представлять модель в виде исполнимого приложения, можно консольного, принимающего данные по stdin или файлы csv с командной строки т.к. этот вариант м.б. легко, без заморочек использован и защищен, посредством обфускации по времени и.т.д.

Наверно да, консольное вряд ли, скорее длл, чтобы можно было грузануть в свою апликуху и прогнать на тестере, вообще для начала проверить как коррелирует прогноз с рынком, бывает модель слабая, спред не побеждает, но тем не менее может быть использована в ансамбле, если не очень часто переворачивается но положительно коррелирует с рынком(приращениями цены) более 1-2% и не сильно с другими моделями ансамбля, но там нужно смотреть, много способов обмануться.

Другой вопрос что никто не может проконтролировать что блэк-бокс который был для "пробы" окажется тем же за бабло, но это в интересах обоих сторон по идее... 

В общем можно попробовать, опубликовать модельки например для евробакса для m1 с дукаса, но что бы не HFT, 10-30 сделок в день примерно, "опечатаем" эти модельки, например криптоподписью, а через месяцок другой посмотрим у кого они реально рынок побеждают а у кого фантазии.

 
Сигнал бы для начала... а потом уж возиться с запечатыванием, распечатыванием и интеграцией в МТ (и другие). А то кучу времени потратишь на сервисные функции вместо того, чтобы модель хорошую приготовить. А ведь может оказаться - зря. Будет сигнал достойный внимания - можно будет и заморачиваться.
 
elibrarius:
Сигнал бы для начала... а потом уж возиться с запечатыванием, распечатыванием и интеграцией в МТ (и другие). А то кучу времени потратишь на сервисные функции вместо того, чтобы модель хорошую приготовить. А ведь может оказаться - зря. Будет сигнал достойный внимания - можно будет и заморачиваться.

как у вас дела кстати с моделями на Р, есть прогресс?

все хотел инвестировать куда-то а сигналов реально нет ни у кого :)

 
Maxim Dmitrievsky:

как у вас дела кстати с моделями на Р, есть прогресс?

все хотел инвестировать куда-то а сигналов реально нет ни у кого :)

Ничего интересного пока не нашел.
И месяца 2 вообще буду другим заниматься. Потом может вернусь.
 
Женя:

Вы случайно не совладелец какого-нибудь банка вместе с Алешей? слишком уж наполеоновский размах мысли

Даже Греф об таком старается умалчивать

 

Женя:

МТ-тестер нельзя кастомизировать, это тоже черный ящик, нельзя даже протестировать правильно ли он работает, да и скорость работы всё ещё остаётся на порядки ниже того что можно засетапить самостоятельно, особенно если простые варианты для оптимизации. Ну и как бы это сказать... короче вас не воспримут всерьёз с "советником" к какой либо публичной платформе, а С++ dll юзают в равной степени и в Рентехе и Голдмансаксе.

Разумнее вообще никак не ограничевать, можно и не МО, главное чтобы всё на автомате, подключил, прогнал на тестере в будущем когда оно придет, получил результат в виде эквити.


Противоречие - с одной стороны недоверие тестеру, а с другой стороны, на него же и вся надежда.

Вывод - у вас имеется уникальный, супер объективный и быстрый тестер.

Надеюсь вы не будете агитировать всех за написание такого же тестера т.к. это совсем другая, обширная тема.

В таком случае возможны два варианта, или вы поделитесь этим тестером, для объективного испытания моделей со всеми желающими или мы наперед признаем ваши модели лучшими из лучших т.к. уже сейчас понимаем, что ваш собственный тестер вас не подведет:)

 
Ivan Negreshniy:

Противоречие - с одной стороны недоверие тестеру, а с другой стороны, на него же и вся надежда.

Вывод - у вас имеется уникальный, супер объективный и быстрый тестер.

Надеюсь вы не будете агитировать всех за написание такого же тестера т.к. это совсем другая, обширная тема.

В таком случае возможны два варианта, или вы поделитесь этим тестером, для объективного испытания моделей со всеми желающими или мы наперед признаем ваши модели лучшими из лучших т.к. уже сейчас понимаем, что ваш собственный тестер вас не подведет:)

Есть тестер, разумеется, поделиться совсем не жалко это достаточно простой алгоритм что даже удивляет сам факт просьбы им поделиться))

Противоречия нет и нет никакой надежды.

Причина обращения: