Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 402

 
Алёша:

XGB - https://en.wikipedia.org/wiki/Xgboost - термоядерное оружие машинного обучения.

3 месяца для хфт не совсем достаточно, для полного цикла моделирования, так как модель нужно протестировать на разных рынках, сменах режимов, флэш-крышах и разных лебедях, синтетическое стресс-тестирование не может этого сделать, так как реальный рынок. Конечная модель по большей части будет использовать данные не более чем за неделю, но чтобы сконфигурировать её понадобится гонять на 1-3 годовых выборках, для уверенности что она везде не облажается. За 3 месяца данных можно обучиться и если датасаентисты знают своё дело, то получится обычная баблокосилка, но однажды, может через 3 месяца может через пол года, всё резко может сломаться, по "не известной" причине, точней известной, так как модель не сталкивалась с таким мета- состоянием рынка и включила самодеятельность.


а, ну так переобучать же надо систематически, какой смысли обучать хфт за 5 лет, на это ни нервов ни ресурсов не хватит

ах, градиент бустинг.. слышал-слышал, но не делал. Чем дальше в лес, тем сложнее термины

 
Maxim Dmitrievsky:


какой смысли обучать хфт за 5 лет, на это ни нервов ни ресурсов не хватит

Возможно парни с LTCM тоже в том числе и так аргументировали)) Говорят что если бы они в своих моделях, посмотрели назад в двое дальше, то так бы фиерично не слились.

Обучение в любом случае не идет сразу на всей выборке за 5 лет, оно понятное дело скользящим окном берет выборку, с постоянным до обучением, но важно знать как быстро модель "поймет" когда что то сильно поменяется в рынке и это не выброс, не чья то глупость, а не будет смело доливать против вдруг возникшей тенденции, то звонка Коли.

 
Алёша:

Возможно парни с LTCM тоже в том числе и так аргументировали)) Говорят что если бы они в своих моделях, посмотрели назад в двое дальше, то так бы фиерично не слились.

Обучение в любом случае не идет сразу на всей выборке за 5 лет, оно понятное дело скользящим окном берет выборку, с постоянным до обучением, но важно знать как быстро модель "поймет" когда что то сильно поменяется в рынке и это не выброс, не чья то глупость, а не будет смело доливать против вдруг возникшей тенденции, то звонка Коли.


Мдя...... вы умудряетесь обсирать работу, а сами говорите про совершенно другие весчи. Как правило, модель признаётся не годной когда она пробивает линию поддержки кривой баланса, и то потом востанавливается, как я показывал ранее... Доверять или не доверять работе модели тут вопрос филосовский. Никто не говорит что за три месяца данных это слишком мало. НО у меня возникает вопрос, откуда вы знаете как я их собираю и к чему они относятся?????? Ну просто интересно. С чего вы вдруг взяли что модель потеряет смысл если в течении трёх месяцев ей были представленны все возможные варианты развития рынка?????

Прежде чем прогнозировать рынок, нужно понимать что это. Да изменение рынка в глобальном периоде происходит, НО я использую данные которые являются причиной для цены, тоесть именно эти данные меняют цену, а не наоборот. Тем более после выгрузки я применяю уникальную обработку очистки данных от мусора, по этому и получаю такие модели. Хотя сама торговля у меня не ахти какая. СРОЧНО нужен РОБОТ. И сразу вопрос к аудитории... У когонибуть есть скелет торговог7о робота который учитывает реквоты, уёты, и прочую фигню при реальной торговле?????

 
Mihail Marchukajtes:


Никто не говорит что за три месяца данных это слишком мало. НО у меня возникает вопрос, откуда вы знаете как я их собираю и к чему они относятся?????? Ну просто интересно. С чего вы вдруг взяли что модель потеряет смысл если в течении трёх месяцев ей были представленны все возможные варианты развития рынка?????

Если Вы обучали на данных за 3 месяца, то нельзя рассчитывать что модель проработает существенно дольше. Какой рынок модель видела, такой и сможет торговать. Конкретно Ваш датасет - вообще полная ерунда, торговать по нему что гадать на кофейной гуще. Тоже относится к "машине Решетова" которая выдает коэфициенты для линейной модели, когда как данные совсем не линейные. Нужно быть совсем не далеким чтобы поверить в этот вздор что на датасете в <500 точек линейная модель училась недели, потому что это "ИИ")))))))))..... Я уж не знаю.... это вздор по круче мартингейла и "разгона депо"

 
Алёша:

Если Вы обучали на данных за 3 месяца, то нельзя рассчитывать что модель проработает существенно дольше. Какой рынок модель видела, такой и сможет торговать. Конкретно Ваш датасет - вообще полная ерунда, торговать по нему что гадать на кофейной гуще. Тоже относится к "машине Решетова" которая выдает коэфициенты для линейной модели, когда как данные совсем не линейные. Нужно быть совсем не далеким чтобы поверить в этот вздор что на датасете в <500 точек линейная модель училась недели, потому что это "ИИ")))))))))..... Я уж не знаю.... это вздор по круче мартингейла и "разгона депо"


Всмысли недели???? Алёша, ну ты в натуре АЛЁША Ха ха ха.... ну что за народ пошёл. ЛАдно Алексеюшка ты наш, вот почитай сначала статью тут и ты поймёшь что мои 500 точек я собрал за три месяца, потому как я не пихаю классификатору каждый бар, а делаю это в определённое время и поэтому за 500 точек охватываю рынок за 3 месяца, а то что твоя модель не смогла натренироватся на него правильно, так это потому что у тебя твоя система ИИ  "ХРЕНОВАЯ". Я даже её в скобки взял чтоб как то превознести :-) Эх Алёша, Алёша......То то я смотрю к выходным и троли проснулись..... Ладно мне лично пофиг, открою тебе на последок ещё один секрет, так для развития, чтоб ты понимал на кого "батон крошишь".

Всем тем кто посчитал мой датасет хуже 50% посвещается!!!!!!! Ваша система ИИ построена не правильно либо в ней есть ошибка ЛИБО!!!!!!!! И тут барабанная дробь.... Ваша система ограничена количеством изучаемого материала, есть вы используете сетки которые способны на 2-3 неделях обучится корректно (давайте возьмём за правило что переобучение отсутствует полностью) и проработать в течении одной недели или двух. Такие системы есть и в них нет ничего страшного ЭТО РАБОТАЕТ!!!! НО когда вы падаетё на неё большый дата сеть, она начинает жутко переобучатся или недообучатся, что в конечном итоге приводит к большим ошибкам при обучении и вы начинаете считать что датасет хреновый, вполне разумно для Ваших систем ИИ. НО, когда система ИИ реально крута, она способна построить модель (и не переобучиться) даже на этом дата сете, на котором у ВАС не получилось.... Понимаете!!!! Просто модель будет состоять из большого количества входов, я так думаю 10-12 и полином будет достаточной длинны и поверьте, такая модель будет иметь более 50% профита. Вернее даже для оптимизатора РЕШЕТОВА есть предел, но он гораздо больше чем у тех у кого не получилось..... Как то так.....

 

И что самое интересное что основной результат работы этого оптимизатора ЭТО процент обобщения и я строил модели со 100% уровнем обобщения. Но при увеличении выборки процент начинает падать, и наступит момент когда он упадёт ниже 50% тогда и начнётся слив модели. Но тут скорее будет апроксимальное приближение к отметке 50. Так или иначе если в данных рыба есть, то он её найдёт, если нет, то селяви.....

Он очень хорошо ещё отвечает на вопрос насколько хороши данные к выбранной переменной, если данные полное говно, то это будет видно сразу....

Я вот угараю, разбил датасет который выкладывал, и одна из выборок получилась 138 строк, запустил, жду.... будет интересно выложу результа....

 
Mihail Marchukajtes:


Всмысли недели???? Алёша, ну ты в натуре АЛЁША Ха ха ха.... ну что за народ пошёл. ЛАдно Алексеюшка ты наш, вот почитай сначала статью тут и ты поймёшь что мои 500 точек я собрал за три месяца, потому как я не пихаю классификатору каждый бар, а делаю это в определённое время и поэтому за 500 точек охватываю рынок за 3 месяца, а то что твоя модель не смогла натренироватся на него правильно, так это потому что у тебя твоя система ИИ  "ХРЕНОВАЯ". Я даже её в скобки взял чтоб как то превознести :-) Эх Алёша, Алёша......То то я смотрю к выходным и троли проснулись..... Ладно мне лично пофиг, открою тебе на последок ещё один секрет, так для развития, чтоб ты понимал на кого "батон крошишь".

Всем тем кто посчитал мой датасет хуже 50% посвещается!!!!!!! Ваша система ИИ построена не правильно либо в ней есть ошибка ЛИБО!!!!!!!! И тут барабанная дробь.... Ваша система ограничена количеством изучаемого материала, есть вы используете сетки которые способны на 2-3 неделях обучится корректно (давайте возьмём за правило что переобучение отсутствует полностью) и проработать в течении одной недели или двух. Такие системы есть и в них нет ничего страшного ЭТО РАБОТАЕТ!!!! НО когда вы падаетё на неё большый дата сеть, она начинает жутко переобучатся или недообучатся, что в конечном итоге приводит к большим ошибкам при обучении и вы начинаете считать что датасет хреновый, вполне разумно для Ваших систем ИИ. НО, когда система ИИ реально крута, она способна построить модель (и не переобучиться) даже на этом дата сете, на котором у ВАС не получилось.... Понимаете!!!! Просто модель будет состоять из большого количества входов, я так думаю 10-12 и полином будет достаточной длинны и поверьте, такая модель будет иметь более 50% профита. Вернее даже для оптимизатора РЕШЕТОВА есть предел, но он гораздо больше чем у тех у кого не получилось..... Как то так.....


И что самое интересное что основной результат работы этого оптимизатора ЭТО процент обобщения и я строил модели со 100% уровнем обобщения. Но при увеличении выборки процент начинает падать, и наступит момент когда он упадёт ниже 50% тогда и начнётся слив модели. Но тут скорее будет апроксимальное приближение к отметке 50. Так или иначе если в данных рыба есть, то он её найдёт, если нет, то селяви.....

Он очень хорошо ещё отвечает на вопрос насколько хороши данные к выбранной переменной, если данные полное говно, то это будет видно сразу....

Я вот угараю, разбил датасет который выкладывал, и одна из выборок получилась 138 строк, запустил, жду.... будет интересно выложу результа....

Я не буду с Вами спорить, не с чем спорить, Вы несете полную ересь, “100% обобщение”)))))) По моему Вы даже не понимаете различие между линейной и нелинейной моделью. А “машина Решетова” – линейная, она даже c XORом не справится, это тупо оптимизация коэффициентов разделяющей гиперплоскости какой то псевдогенетикой, детский лепет блин…

 

Всё, малышей не обижаю, я плохой, злой дядя, рассказал что деда мороза не существует)))

 
Алёша:

Я не буду с Вами спорить, не с чем спорить, Вы несете полную ересь, “100% обобщение”)))))) По моему Вы даже не понимаете различие между линейной и нелинейной моделью. А “машина Решетова” – линейная, она даже c XORом не справится, это тупо оптимизация коэффициентов гиперплоскости какой то псевтогенетикой, детский лепет блин…

 

Всё, малышей не обижаю, я плохой, злой дядя, рассказал что деда мороза не существует)))


ДА!!!!! Так вот я как раз и есть ДЕД МОРОЗ!!! И каждый год я поздравляю детей с этим прекрасным праздником. Вы даже тут умудрились мне проиграть :-)
 
Алёша:

Я не буду с Вами спорить, не с чем спорить, Вы несете полную ересь, “100% обобщение”)))))) По моему Вы даже не понимаете различие между линейной и нелинейной моделью. А “машина Решетова” – линейная, она даже c XORом не справится, это тупо оптимизация коэффициентов разделяющей гиперплоскости какой то псевдогенетикой, детский лепет блин…

 

Всё, малышей не обижаю, я плохой, злой дядя, рассказал что деда мороза не существует)))


Сейчас посчитает я те скину модель со 100% уровнем обобщения....
 
Mihail Marchukajtes:

Сейчас посчитает я те скину модель со 100% уровнем обобщения....
Не нужно палить грааль, торгуйте срочно по ней, торгуйте! Все скажут Вам спасибо :)
Причина обращения: