Модель не должна обучаться на малых данных

[Удален] 2017.06.11 12:21 #4011

Алёша:

XGB - https://en.wikipedia.org/wiki/Xgboost - термоядерное оружие машинного обучения.

3 месяца для хфт не совсем достаточно, для полного цикла моделирования, так как модель нужно протестировать на разных рынках, сменах режимов, флэш-крышах и разных лебедях, синтетическое стресс-тестирование не может этого сделать, так как реальный рынок. Конечная модель по большей части будет использовать данные не более чем за неделю, но чтобы сконфигурировать её понадобится гонять на 1-3 годовых выборках, для уверенности что она везде не облажается. За 3 месяца данных можно обучиться и если датасаентисты знают своё дело, то получится обычная баблокосилка, но однажды, может через 3 месяца может через пол года, всё резко может сломаться, по "не известной" причине, точней известной, так как модель не сталкивалась с таким мета- состоянием рынка и включила самодеятельность.

а, ну так переобучать же надо систематически, какой смысли обучать хфт за 5 лет, на это ни нервов ни ресурсов не хватит

ах, градиент бустинг.. слышал-слышал, но не делал. Чем дальше в лес, тем сложнее термины

[архив c 17.03.2008] Юмор Трендо-флэтовая стратегия. Ганн, астротехники. Прогнозы, обсуждение

Алёша 2017.06.11 16:10 #4012

Maxim Dmitrievsky:

какой смысли обучать хфт за 5 лет, на это ни нервов ни ресурсов не хватит

Возможно парни с LTCM тоже в том числе и так аргументировали)) Говорят что если бы они в своих моделях, посмотрели назад в двое дальше, то так бы фиерично не слились.

Обучение в любом случае не идет сразу на всей выборке за 5 лет, оно понятное дело скользящим окном берет выборку, с постоянным до обучением, но важно знать как быстро модель "поймет" когда что то сильно поменяется в рынке и это не выброс, не чья то глупость, а не будет смело доливать против вдруг возникшей тенденции, то звонка Коли.

Достаточность выборки Нужен ли лок в Есть ли закономерность в

Mihail Marchukajtes 2017.06.11 16:28 #4013

Алёша:

Возможно парни с LTCM тоже в том числе и так аргументировали)) Говорят что если бы они в своих моделях, посмотрели назад в двое дальше, то так бы фиерично не слились.

Обучение в любом случае не идет сразу на всей выборке за 5 лет, оно понятное дело скользящим окном берет выборку, с постоянным до обучением, но важно знать как быстро модель "поймет" когда что то сильно поменяется в рынке и это не выброс, не чья то глупость, а не будет смело доливать против вдруг возникшей тенденции, то звонка Коли.

Мдя...... вы умудряетесь обсирать работу, а сами говорите про совершенно другие весчи. Как правило, модель признаётся не годной когда она пробивает линию поддержки кривой баланса, и то потом востанавливается, как я показывал ранее... Доверять или не доверять работе модели тут вопрос филосовский. Никто не говорит что за три месяца данных это слишком мало. НО у меня возникает вопрос, откуда вы знаете как я их собираю и к чему они относятся?????? Ну просто интересно. С чего вы вдруг взяли что модель потеряет смысл если в течении трёх месяцев ей были представленны все возможные варианты развития рынка?????

Прежде чем прогнозировать рынок, нужно понимать что это. Да изменение рынка в глобальном периоде происходит, НО я использую данные которые являются причиной для цены, тоесть именно эти данные меняют цену, а не наоборот. Тем более после выгрузки я применяю уникальную обработку очистки данных от мусора, по этому и получаю такие модели. Хотя сама торговля у меня не ахти какая. СРОЧНО нужен РОБОТ. И сразу вопрос к аудитории... У когонибуть есть скелет торговог7о робота который учитывает реквоты, уёты, и прочую фигню при реальной торговле?????

Куплю прибыльного советника! Пиши и зарабатывай на Ошибки, баги, вопросы

Алёша 2017.06.11 17:16 #4014

Mihail Marchukajtes:

Никто не говорит что за три месяца данных это слишком мало. НО у меня возникает вопрос, откуда вы знаете как я их собираю и к чему они относятся?????? Ну просто интересно. С чего вы вдруг взяли что модель потеряет смысл если в течении трёх месяцев ей были представленны все возможные варианты развития рынка?????

Если Вы обучали на данных за 3 месяца, то нельзя рассчитывать что модель проработает существенно дольше. Какой рынок модель видела, такой и сможет торговать. Конкретно Ваш датасет - вообще полная ерунда, торговать по нему что гадать на кофейной гуще. Тоже относится к "машине Решетова" которая выдает коэфициенты для линейной модели, когда как данные совсем не линейные. Нужно быть совсем не далеким чтобы поверить в этот вздор что на датасете в <500 точек линейная модель училась недели, потому что это "ИИ")))))))))..... Я уж не знаю.... это вздор по круче мартингейла и "разгона депо"

ZIG-ZAG советник Забудьте про случайные котировки Обсуждение статьи "Продвинутый ресемплинг

Mihail Marchukajtes 2017.06.11 17:36 #4015

Алёша:

Если Вы обучали на данных за 3 месяца, то нельзя рассчитывать что модель проработает существенно дольше. Какой рынок модель видела, такой и сможет торговать. Конкретно Ваш датасет - вообще полная ерунда, торговать по нему что гадать на кофейной гуще. Тоже относится к "машине Решетова" которая выдает коэфициенты для линейной модели, когда как данные совсем не линейные. Нужно быть совсем не далеким чтобы поверить в этот вздор что на датасете в <500 точек линейная модель училась недели, потому что это "ИИ")))))))))..... Я уж не знаю.... это вздор по круче мартингейла и "разгона депо"

Всмысли недели???? Алёша, ну ты в натуре АЛЁША Ха ха ха.... ну что за народ пошёл. ЛАдно Алексеюшка ты наш, вот почитай сначала статью тут и ты поймёшь что мои 500 точек я собрал за три месяца, потому как я не пихаю классификатору каждый бар, а делаю это в определённое время и поэтому за 500 точек охватываю рынок за 3 месяца, а то что твоя модель не смогла натренироватся на него правильно, так это потому что у тебя твоя система ИИ "ХРЕНОВАЯ". Я даже её в скобки взял чтоб как то превознести :-) Эх Алёша, Алёша......То то я смотрю к выходным и троли проснулись..... Ладно мне лично пофиг, открою тебе на последок ещё один секрет, так для развития, чтоб ты понимал на кого "батон крошишь".

Всем тем кто посчитал мой датасет хуже 50% посвещается!!!!!!! Ваша система ИИ построена не правильно либо в ней есть ошибка ЛИБО!!!!!!!! И тут барабанная дробь.... Ваша система ограничена количеством изучаемого материала, есть вы используете сетки которые способны на 2-3 неделях обучится корректно (давайте возьмём за правило что переобучение отсутствует полностью) и проработать в течении одной недели или двух. Такие системы есть и в них нет ничего страшного ЭТО РАБОТАЕТ!!!! НО когда вы падаетё на неё большый дата сеть, она начинает жутко переобучатся или недообучатся, что в конечном итоге приводит к большим ошибкам при обучении и вы начинаете считать что датасет хреновый, вполне разумно для Ваших систем ИИ. НО, когда система ИИ реально крута, она способна построить модель (и не переобучиться) даже на этом дата сете, на котором у ВАС не получилось.... Понимаете!!!! Просто модель будет состоять из большого количества входов, я так думаю 10-12 и полином будет достаточной длинны и поверьте, такая модель будет иметь более 50% профита. Вернее даже для оптимизатора РЕШЕТОВА есть предел, но он гораздо больше чем у тех у кого не получилось..... Как то так.....

Обсуждение статьи "Секвента ДеМарка <this topic is a Достаточность выборки

Mihail Marchukajtes 2017.06.11 17:43 #4016

И что самое интересное что основной результат работы этого оптимизатора ЭТО процент обобщения и я строил модели со 100% уровнем обобщения. Но при увеличении выборки процент начинает падать, и наступит момент когда он упадёт ниже 50% тогда и начнётся слив модели. Но тут скорее будет апроксимальное приближение к отметке 50. Так или иначе если в данных рыба есть, то он её найдёт, если нет, то селяви.....

Он очень хорошо ещё отвечает на вопрос насколько хороши данные к выбранной переменной, если данные полное говно, то это будет видно сразу....

Я вот угараю, разбил датасет который выкладывал, и одна из выборок получилась 138 строк, запустил, жду.... будет интересно выложу результа....

Обсуждение статьи "Секвента ДеМарка Прогнозирование цены с использованием Оценка эффективности фильтров при

Алёша 2017.06.11 18:16 #4017

Mihail Marchukajtes:

Всмысли недели???? Алёша, ну ты в натуре АЛЁША Ха ха ха.... ну что за народ пошёл. ЛАдно Алексеюшка ты наш, вот почитай сначала статью тут и ты поймёшь что мои 500 точек я собрал за три месяца, потому как я не пихаю классификатору каждый бар, а делаю это в определённое время и поэтому за 500 точек охватываю рынок за 3 месяца, а то что твоя модель не смогла натренироватся на него правильно, так это потому что у тебя твоя система ИИ "ХРЕНОВАЯ". Я даже её в скобки взял чтоб как то превознести :-) Эх Алёша, Алёша......То то я смотрю к выходным и троли проснулись..... Ладно мне лично пофиг, открою тебе на последок ещё один секрет, так для развития, чтоб ты понимал на кого "батон крошишь".

Всем тем кто посчитал мой датасет хуже 50% посвещается!!!!!!! Ваша система ИИ построена не правильно либо в ней есть ошибка ЛИБО!!!!!!!! И тут барабанная дробь.... Ваша система ограничена количеством изучаемого материала, есть вы используете сетки которые способны на 2-3 неделях обучится корректно (давайте возьмём за правило что переобучение отсутствует полностью) и проработать в течении одной недели или двух. Такие системы есть и в них нет ничего страшного ЭТО РАБОТАЕТ!!!! НО когда вы падаетё на неё большый дата сеть, она начинает жутко переобучатся или недообучатся, что в конечном итоге приводит к большим ошибкам при обучении и вы начинаете считать что датасет хреновый, вполне разумно для Ваших систем ИИ. НО, когда система ИИ реально крута, она способна построить модель (и не переобучиться) даже на этом дата сете, на котором у ВАС не получилось.... Понимаете!!!! Просто модель будет состоять из большого количества входов, я так думаю 10-12 и полином будет достаточной длинны и поверьте, такая модель будет иметь более 50% профита. Вернее даже для оптимизатора РЕШЕТОВА есть предел, но он гораздо больше чем у тех у кого не получилось..... Как то так.....

И что самое интересное что основной результат работы этого оптимизатора ЭТО процент обобщения и я строил модели со 100% уровнем обобщения. Но при увеличении выборки процент начинает падать, и наступит момент когда он упадёт ниже 50% тогда и начнётся слив модели. Но тут скорее будет апроксимальное приближение к отметке 50. Так или иначе если в данных рыба есть, то он её найдёт, если нет, то селяви.....

Он очень хорошо ещё отвечает на вопрос насколько хороши данные к выбранной переменной, если данные полное говно, то это будет видно сразу....

Я вот угараю, разбил датасет который выкладывал, и одна из выборок получилась 138 строк, запустил, жду.... будет интересно выложу результа....

Я не буду с Вами спорить, не с чем спорить, Вы несете полную ересь, “100% обобщение”)))))) По моему Вы даже не понимаете различие между линейной и нелинейной моделью. А “машина Решетова” – линейная, она даже c XORом не справится, это тупо оптимизация коэффициентов разделяющей гиперплоскости какой то псевдогенетикой, детский лепет блин…

Всё, малышей не обижаю, я плохой, злой дядя, рассказал что деда мороза не существует)))

Есть ли ГРААЛЬ на Все о MQL5 Wizard: Рынок -- управляемая динамическая

Mihail Marchukajtes 2017.06.11 18:20 #4018

Алёша:

Я не буду с Вами спорить, не с чем спорить, Вы несете полную ересь, “100% обобщение”)))))) По моему Вы даже не понимаете различие между линейной и нелинейной моделью. А “машина Решетова” – линейная, она даже c XORом не справится, это тупо оптимизация коэффициентов гиперплоскости какой то псевтогенетикой, детский лепет блин…

Всё, малышей не обижаю, я плохой, злой дядя, рассказал что деда мороза не существует)))

ДА!!!!! Так вот я как раз и есть ДЕД МОРОЗ!!! И каждый год я поздравляю детей с этим прекрасным праздником. Вы даже тут умудрились мне проиграть :-)

Mihail Marchukajtes 2017.06.11 18:21 #4019

Алёша:

Я не буду с Вами спорить, не с чем спорить, Вы несете полную ересь, “100% обобщение”)))))) По моему Вы даже не понимаете различие между линейной и нелинейной моделью. А “машина Решетова” – линейная, она даже c XORом не справится, это тупо оптимизация коэффициентов разделяющей гиперплоскости какой то псевдогенетикой, детский лепет блин…

Всё, малышей не обижаю, я плохой, злой дядя, рассказал что деда мороза не существует)))

Сейчас посчитает я те скину модель со 100% уровнем обобщения....

Алёша 2017.06.11 18:56 #4020

Mihail Marchukajtes:

Сейчас посчитает я те скину модель со 100% уровнем обобщения....

Не нужно палить грааль, торгуйте срочно по ней, торгуйте! Все скажут Вам спасибо :)

Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 402