Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 1112

 
Yuriy Asaulenko:

В обычный CSV-файл задача решается с тем-же успехом и быстродействием. И, кроме того, вообще не надо ни с чем разбираться-заморачиваться.

эх не разобрались и сразу комментить)

с выгрузкой истории я согласен, в CSV удобней. Но для работы в онлайне с уже готовыми моделями...

 
itslek:

эх не разобрались и сразу комментить)

с выгрузкой истории я согласен, в CSV удобней. Но для работы в онлайне с уже готовыми моделями...

В онлайне столько тиков нэ нада. И в памяти поместятся.

А не в онлайне быстродействие для экспорта особо нэ нада. Из CSV в БД руками импортируешь.

 
Vizard_:

+1

Присоеденюсь данные важнее модели, но и метод её построения тоже важен. В этом случае я расцениваю это как 50 на 50.

От модели важно чтобы при неоднократных оптимизациях она выдавала обобщённые модели более 50%. То есть из 10 оптимизаций чтобы 5 и более моделей были обобщены на достаточном уровне. Почему именно так??? Потому как при выборе из 10 моделей вероятность выбратьб рабочую больше. Что толку от алгоритма если он из 10 оптимизаций выдаёт только 2 обобщённые модели. Вероятность что эксперт выберет именно рабочую модель при таком результате очень мала, а знамо и проку от такого аллгоритма тоже мало.

От данных важно чтобы они были причиной для целевой функции, хотя бы процентов от 20 и более. Если причина во входных данных есть то отвественность за её поиск ложится на алгоритм оптимизации.


Мне до сих пор интерресно проверить свои данный на других аллгоритмах и понять что является успехом. Наличие данных или же оптимизатор Решетова, который тут все ненавидят, но чтобы это сделать нужнобудет провести проверку в реале, а с учётом того что народ тут скупенький. КСТАТИ........

Если кто еще задаётся этим вопросоим я думаю смогу дать на него ответ каким образом: Я подготавливаю данные. Вы обучаете свой ИИ, ьпосле обучения мы проверяем работу модели на ООС(желательно в реале), если советник заработает и мы убедимся что модель рабочая, то получается что Ваш алгоритм оптимизации рабочий (сразу скажу мне он не нужен) и значит нужно сделать упор на поиск входных данных. Если с моими щанными не удастся получить рабочую модель, знамо следует доработать алгоритм. Думаю это заинтересует новичков, я между тем тоже убежусь что является моим успехом. Данные или жзе наличие мощного оптимизатора Решетова.

Ну что.... кто принимает сей вызов?????

 
Mihail Marchukajtes:

Присоеденюсь данные важнее модели, но и метод её построения тоже важен. В этом случае я расцениваю это как 50 на 50.

От модели важно чтобы при неоднократных оптимизациях она выдавала обобщённые модели более 50%. То есть из 10 оптимизаций чтобы 5 и более моделей были обобщены на достаточном уровне. Почему именно так??? Потому как при выборе из 10 моделей вероятность выбратьб рабочую больше. Что толку от алгоритма если он из 10 оптимизаций выдаёт только 2 обобщённые модели. Вероятность что эксперт выберет именно рабочую модель при таком результате очень мала, а знамо и проку от такого аллгоритма тоже мало.

От данных важно чтобы они были причиной для целевой функции, хотя бы процентов от 20 и более. Если причина во входных данных есть то отвественность за её поиск ложится на алгоритм оптимизации.


Мне до сих пор интерресно проверить свои данный на других аллгоритмах и понять что является успехом. Наличие данных или же оптимизатор Решетова, который тут все ненавидят, но чтобы это сделать нужнобудет провести проверку в реале, а с учётом того что народ тут скупенький. КСТАТИ........

Если кто еще задаётся этим вопросоим я думаю смогу дать на него ответ каким образом: Я подготавливаю данные. Вы обучаете свой ИИ, ьпосле обучения мы проверяем работу модели на ООС(желательно в реале), если советник заработает и мы убедимся что модель рабочая, то получается что Ваш алгоритм оптимизации рабочий (сразу скажу мне он не нужен) и значит нужно сделать упор на поиск входных данных. Если с моими щанными не удастся получить рабочую модель, знамо следует доработать алгоритм. Думаю это заинтересует новичков, я между тем тоже убежусь что является моим успехом. Данные или жзе наличие мощного оптимизатора Решетова.

Ну что.... кто принимает сей вызов?????

Таргеты в данных уже проставлены? Какая метрика?)

Если свести задачу к простой соревновательной форме по Машинному Обучению, то можно привлечь не только трейдеров)

 
itslek:

Таргеты в данных уже проставлены? Какая метрика?)

Если свести задачу к простой соревновательной форме по Машинному Обучению, то можно привлечь не только трейдеров)

Да, данные с целевой уже будут. Речь идёт о моделях классификации. Тут  проблема в другом, каким образом можно проверить эти модели полученный в Ваших система???? Желательно на реале...

 
Mihail Marchukajtes:

Да, данные с целевой уже будут. Речь идёт о моделях классификации. Тут  проблема в другом, каким образом можно проверить эти модели полученный в Ваших система???? Желательно на реале...

Для начала проверить хотяб на отложеной выборке. Допустим даете данные за 2012-2016г. 2017 тест.  2018 оставляете у себя для окончательной проверки (чтоб небыло подгона).

Подожди ты с реалом) не дели шкуру не убитого медведя ;) сначала нужно сделать модель, которая хотя бы валидацию смогла бы пройти, а потом уже пытаться выкатить этого слона в прод. Это 2 совсем разные задачи.

 
itslek:

Для начала проверить хотяб на отложеной выборке. Допустим даете данные за 2012-2016г. 2017 тест.  2018 оставляете у себя для окончательной проверки (чтоб небыло подгона).

Подожди ты с реалом) не дели шкуру не убитого медведя ;)

Ну и каким образом я проверю модель? если проверку я делаю в тестере МТ. После оптимизации мы сможем загрузить модель в МТ4?

 
Mihail Marchukajtes:

Ну и каким образом я проверю модель? если проверку я делаю в тестере МТ. После оптимизации мы сможем загрузить модель в МТ4?

и я тебе о чем. Для начала поставь задачу в вакуме. со своей метрикой


Если хочешь прогнать в тестере с тралом там и прочими плюшками:

Предоставь данные в .csv с таргетом (я так понял у тебя это бинарная классификация). далее обучаем модели и предсказываем таргет. полученный результат загружаем в виде списка ответов модели в тот-же тестер и прогоняем. Но делать это для каждой модели - еще 1 вариант подгона, лучше подумать над метрикой или таргетом. А в тестере гнать только последний вариант. 

А для реалтайма это отдельный гемор, и не все модели можно завернуть в dll 

 
itslek:

и я тебе о чем. Для начала поставь задачу в вакуме. со своей метрикой


Если хочешь прогнать в тестере с тралом там и прочими плюшками:

Предоставь данные в .csv с таргетом (я так понял у тебя это бинарная классификация). далее обучаем модели и предсказываем таргет. полученный результат загружаем в виде списка ответов модели в тот-же тестер и прогоняем. Но делать это для каждой модели - еще 1 вариант подгона, лучше подумать над метрикой или таргетом. А в тестере гнать только последний вариант. 

А для реалтайма это отдельный гемор, и не все модели можно завернуть в dll 

Ну незнаю у меня все модели заводятся в МТ и чувствуют себя там нормально.

А метрику я выбрал вот эту. Я кстати в оптимизаторе поменял именно на неё метрика Мэтьюса она имеею параболическую оцунку в отлии от метрик специфичности или чувствительности. Но я так понимаю если алгоритм оптимизации готов то и вопрос с метрикой решён....

Лучшая метрика для оценки точности классификационных моделей | DataReview.info
Лучшая метрика для оценки точности классификационных моделей | DataReview.info
  • datareview.info
Оценка качества классификационных моделей — сложная и трудоемкая задача. Сперва аналитик оценивает робастность классификационной модели с помощью таких средств, как AIC-BIC, площадь под ROC-кривой, критерий согласия Колмогорова-Смирнова и др. Следующим логическим шагом является оценка точности модели. Чтобы понять, почему эта задача является...
 
Vizard_:

Все, любая модель это формула, если ты юзаешь черные ящики откуда нихера не выдернишь, твои проблемы.
Какой тестер, аccuracy и все... Ты не представляшь кто такой Миша и какое увлкательное путешествие ждет
тебя впереди)))

А главное прибыльное....

Правда я не сторонник ДЛЛ и всяких там связок... Мне нравится чистый МКУЛЬ в его первозданном виде :-)

Причина обращения: