Для МЛ данные важнее хорошей модели, но и метод ее построения тоже важен - Общее обсуждение

itslek 2018.10.18 16:12 #11111

Yuriy Asaulenko:

В обычный CSV-файл задача решается с тем-же успехом и быстродействием. И, кроме того, вообще не надо ни с чем разбираться-заморачиваться.

эх не разобрались и сразу комментить)

с выгрузкой истории я согласен, в CSV удобней. Но для работы в онлайне с уже готовыми моделями...

Yuriy Asaulenko 2018.10.18 16:15 #11112

itslek:

эх не разобрались и сразу комментить)

с выгрузкой истории я согласен, в CSV удобней. Но для работы в онлайне с уже готовыми моделями...

В онлайне столько тиков нэ нада. И в памяти поместятся.

А не в онлайне быстродействие для экспорта особо нэ нада. Из CSV в БД руками импортируешь.

Mihail Marchukajtes 2018.10.18 16:16 #11113

Vizard_:

+1

Присоеденюсь данные важнее модели, но и метод её построения тоже важен. В этом случае я расцениваю это как 50 на 50.

От модели важно чтобы при неоднократных оптимизациях она выдавала обобщённые модели более 50%. То есть из 10 оптимизаций чтобы 5 и более моделей были обобщены на достаточном уровне. Почему именно так??? Потому как при выборе из 10 моделей вероятность выбратьб рабочую больше. Что толку от алгоритма если он из 10 оптимизаций выдаёт только 2 обобщённые модели. Вероятность что эксперт выберет именно рабочую модель при таком результате очень мала, а знамо и проку от такого аллгоритма тоже мало.

От данных важно чтобы они были причиной для целевой функции, хотя бы процентов от 20 и более. Если причина во входных данных есть то отвественность за её поиск ложится на алгоритм оптимизации.

Мне до сих пор интерресно проверить свои данный на других аллгоритмах и понять что является успехом. Наличие данных или же оптимизатор Решетова, который тут все ненавидят, но чтобы это сделать нужнобудет провести проверку в реале, а с учётом того что народ тут скупенький. КСТАТИ........

Если кто еще задаётся этим вопросоим я думаю смогу дать на него ответ каким образом: Я подготавливаю данные. Вы обучаете свой ИИ, ьпосле обучения мы проверяем работу модели на ООС(желательно в реале), если советник заработает и мы убедимся что модель рабочая, то получается что Ваш алгоритм оптимизации рабочий (сразу скажу мне он не нужен) и значит нужно сделать упор на поиск входных данных. Если с моими щанными не удастся получить рабочую модель, знамо следует доработать алгоритм. Думаю это заинтересует новичков, я между тем тоже убежусь что является моим успехом. Данные или жзе наличие мощного оптимизатора Решетова.

Ну что.... кто принимает сей вызов?????

[ВНИМАНИЕ, ТЕМА ЗАКРЫТА!] Любой Достаточность выборки Асинхронное и многопоточное программирование

itslek 2018.10.18 16:22 #11114

Mihail Marchukajtes:

Присоеденюсь данные важнее модели, но и метод её построения тоже важен. В этом случае я расцениваю это как 50 на 50.

От модели важно чтобы при неоднократных оптимизациях она выдавала обобщённые модели более 50%. То есть из 10 оптимизаций чтобы 5 и более моделей были обобщены на достаточном уровне. Почему именно так??? Потому как при выборе из 10 моделей вероятность выбратьб рабочую больше. Что толку от алгоритма если он из 10 оптимизаций выдаёт только 2 обобщённые модели. Вероятность что эксперт выберет именно рабочую модель при таком результате очень мала, а знамо и проку от такого аллгоритма тоже мало.

От данных важно чтобы они были причиной для целевой функции, хотя бы процентов от 20 и более. Если причина во входных данных есть то отвественность за её поиск ложится на алгоритм оптимизации.

Мне до сих пор интерресно проверить свои данный на других аллгоритмах и понять что является успехом. Наличие данных или же оптимизатор Решетова, который тут все ненавидят, но чтобы это сделать нужнобудет провести проверку в реале, а с учётом того что народ тут скупенький. КСТАТИ........

Если кто еще задаётся этим вопросоим я думаю смогу дать на него ответ каким образом: Я подготавливаю данные. Вы обучаете свой ИИ, ьпосле обучения мы проверяем работу модели на ООС(желательно в реале), если советник заработает и мы убедимся что модель рабочая, то получается что Ваш алгоритм оптимизации рабочий (сразу скажу мне он не нужен) и значит нужно сделать упор на поиск входных данных. Если с моими щанными не удастся получить рабочую модель, знамо следует доработать алгоритм. Думаю это заинтересует новичков, я между тем тоже убежусь что является моим успехом. Данные или жзе наличие мощного оптимизатора Решетова.

Ну что.... кто принимает сей вызов?????

Таргеты в данных уже проставлены? Какая метрика?)

Если свести задачу к простой соревновательной форме по Машинному Обучению, то можно привлечь не только трейдеров)

Mihail Marchukajtes 2018.10.18 16:34 #11115

itslek:

Таргеты в данных уже проставлены? Какая метрика?)

Если свести задачу к простой соревновательной форме по Машинному Обучению, то можно привлечь не только трейдеров)

Да, данные с целевой уже будут. Речь идёт о моделях классификации. Тут проблема в другом, каким образом можно проверить эти модели полученный в Ваших система???? Желательно на реале...

itslek 2018.10.18 16:39 #11116

Mihail Marchukajtes:

Да, данные с целевой уже будут. Речь идёт о моделях классификации. Тут проблема в другом, каким образом можно проверить эти модели полученный в Ваших система???? Желательно на реале...

Для начала проверить хотяб на отложеной выборке. Допустим даете данные за 2012-2016г. 2017 тест. 2018 оставляете у себя для окончательной проверки (чтоб небыло подгона).

Подожди ты с реалом) не дели шкуру не убитого медведя ;) сначала нужно сделать модель, которая хотя бы валидацию смогла бы пройти, а потом уже пытаться выкатить этого слона в прод. Это 2 совсем разные задачи.

Самый крутой советник, такого Проблема с валидацией советника Ищу напарника по созданию

Mihail Marchukajtes 2018.10.18 16:43 #11117

itslek:

Для начала проверить хотяб на отложеной выборке. Допустим даете данные за 2012-2016г. 2017 тест. 2018 оставляете у себя для окончательной проверки (чтоб небыло подгона).

Подожди ты с реалом) не дели шкуру не убитого медведя ;)

Ну и каким образом я проверю модель? если проверку я делаю в тестере МТ. После оптимизации мы сможем загрузить модель в МТ4?

itslek 2018.10.18 16:49 #11118

Mihail Marchukajtes:

Ну и каким образом я проверю модель? если проверку я делаю в тестере МТ. После оптимизации мы сможем загрузить модель в МТ4?

и я тебе о чем. Для начала поставь задачу в вакуме. со своей метрикой

Если хочешь прогнать в тестере с тралом там и прочими плюшками:

Предоставь данные в .csv с таргетом (я так понял у тебя это бинарная классификация). далее обучаем модели и предсказываем таргет. полученный результат загружаем в виде списка ответов модели в тот-же тестер и прогоняем. Но делать это для каждой модели - еще 1 вариант подгона, лучше подумать над метрикой или таргетом. А в тестере гнать только последний вариант.

А для реалтайма это отдельный гемор, и не все модели можно завернуть в dll

В чем причина сильно Есть ли закономерность в Целесообразность

Mihail Marchukajtes 2018.10.18 17:03 #11119

itslek:

и я тебе о чем. Для начала поставь задачу в вакуме. со своей метрикой

Если хочешь прогнать в тестере с тралом там и прочими плюшками:

Предоставь данные в .csv с таргетом (я так понял у тебя это бинарная классификация). далее обучаем модели и предсказываем таргет. полученный результат загружаем в виде списка ответов модели в тот-же тестер и прогоняем. Но делать это для каждой модели - еще 1 вариант подгона, лучше подумать над метрикой или таргетом. А в тестере гнать только последний вариант.

А для реалтайма это отдельный гемор, и не все модели можно завернуть в dll

Ну незнаю у меня все модели заводятся в МТ и чувствуют себя там нормально.

А метрику я выбрал вот эту. Я кстати в оптимизаторе поменял именно на неё метрика Мэтьюса она имеею параболическую оцунку в отлии от метрик специфичности или чувствительности. Но я так понимаю если алгоритм оптимизации готов то и вопрос с метрикой решён....

Лучшая метрика для оценки точности классификационных моделей | DataReview.info

datareview.info

Оценка качества классификационных моделей — сложная и трудоемкая задача. Сперва аналитик оценивает робастность классификационной модели с помощью таких средств, как AIC-BIC, площадь под ROC-кривой, критерий согласия Колмогорова-Смирнова и др. Следующим логическим шагом является оценка точности модели. Чтобы понять, почему эта задача является...

а вот ArrayBsearch Автоматическое создание признака принадлежности Статистика, как способ заглянуть

Mihail Marchukajtes 2018.10.18 17:08 #11120

Vizard_:

Все, любая модель это формула, если ты юзаешь черные ящики откуда нихера не выдернишь, твои проблемы.
Какой тестер, аccuracy и все... Ты не представляшь кто такой Миша и какое увлкательное путешествие ждет
тебя впереди)))

А главное прибыльное....

Правда я не сторонник ДЛЛ и всяких там связок... Мне нравится чистый МКУЛЬ в его первозданном виде :-)

Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 1112