Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 1697

 
Mihail Marchukajtes:
Удивительно, а почему Вы не пользуетесь vtreat-ом для R? Он как раз таки выявляет уровни во входных данных по отношению к целевой и тем самым отбирает те предикты которые для целевой значимы. Помимо классификации там есть вариант и для прогнозирования. Если честно да же и не знаю что бы я без него делал....

Я не знаю принципа отбора предикторов этим инструментом, поэтому и не использую.

Вы знаете этот принцип?

 
elibrarius:
Видимо просто сетка по
либо равномерная но шкале, либо по количеству примеров (перцентили)

Если так, то плохи дела - этого недостаточно.

Пока мой сравнительный эксперимент не завершился - обнаружил ошибку при подготовки данных и пришлось 8 выборок снова ставить на обучение.

Думаю, что к концу недели будет результат, который тут опубликую.

И, буду делать свой "переборщик" условных листьев по этим предикторам (по методу, что я описывал ранее) - с контролем результатов (разной метрики) на каждом шаге.

Рынок описать весь не получится одной моделью, поэтому я буду искать устойчивые закономерности, объединяя их в ТС, и меня не смущает, что часть "пространства" останется неопределенной.

 
Aleksey Vyazmikin:

Я не знаю принципа отбора предикторов этим инструментом, поэтому и не использую.

Вы знаете этот принцип?

Ну если верить словам Дока и  если я правильно его понял для классификации он определяет формируется ли уровни на входной переменой в зависимости от результата целевой. Как я это вижу. Для всех единичек целевой значимый вход стремится попасть в область окрестности уровней, коих тоже может быть несколько. Другими словами если в целевой 100 единичек, то при появлении единички важный вход стремится попасть в какую либо область окрестности уже прошлых данных. В целевой единичек 100, а в важном входе есть 30 областей окрестности данных, но когда бы не появилась единичка в целевой важный вход обязательно придёт в одну из областей окрестностей. И чем больше он туда попадает при появлении единички тем он важней. Там по сути идёт сравнения по отношению к общему набору. То есть результатом работы данного пакета будет выбор тех переменных которые приходили чаще в свои области чем другие. Извини если объяснил сумбурно. Бухаю. Надо думать с утра не успел опомнится лося схватил и понесло меня :-)
 
Добавлю с другой стороны. Втрит вычисляет формирует ли целевая уровни во входных данных. И в тех данных где этих уровней больше и они более конкретизированны, те данные и сильнее. В ообще скрипт для R могу выложить. Он прозвидение Дока я только под себя его запилил. Чтоб результат получать в удобном для меня формате. ФОРМАТЕ ОПТИМИЗАТОРА РЕШЕТОВА УУУУАХАХАХАХА.... Там уже сами допилите под себя. Только обязательно скажите выкладывать или нет....
 
Mihail Marchukajtes:
Ну если верить словам Дока и  если я правильно его понял для классификации он определяет формируется ли уровни на входной переменой в зависимости от результата целевой. Как я это вижу. Для всех единичек целевой значимый вход стремится попасть в область окрестности уровней, коих тоже может быть несколько. Другими словами если в целевой 100 единичек, то при появлении единички важный вход стремится попасть в какую либо область окрестности уже прошлых данных. В целевой единичек 100, а в важном входе есть 30 областей окрестности данных, но когда бы не появилась единичка в целевой важный вход обязательно придёт в одну из областей окрестностей. И чем больше он туда попадает при появлении единички тем он важней. Там по сути идёт сравнения по отношению к общему набору. То есть результатом работы данного пакета будет выбор тех переменных которые приходили чаще в свои области чем другие. Извини если объяснил сумбурно. Бухаю. Надо думать с утра не успел опомнится лося схватил и понесло меня :-)

Да не понятно выражение "стремится попасть в какую либо область окрестности уже прошлых данных".

Бухать ненужно - с рынком сопьешься просто.

Данная коррекция назрела - не припомню, что бы так долго тянули на M15 луч ZZ вниз по каналу Дончианна (ценовой канал) - я со вчерашнего дня начал покупать. Да и индекс RGBI как то на коррекцию пошел, не смотря на укрепление вчера рубля - ЦБ не все облигации разместил на очередном аукционе.

 
Mihail Marchukajtes:
Добавлю с другой стороны. Втрит вычисляет формирует ли целевая уровни во входных данных. И в тех данных где этих уровней больше и они более конкретизированны, те данные и сильнее. В ообще скрипт для R могу выложить. Он прозвидение Дока я только под себя его запилил. Чтоб результат получать в удобном для меня формате. ФОРМАТЕ ОПТИМИЗАТОРА РЕШЕТОВА УУУУАХАХАХАХА.... Там уже сами допилите под себя. Только обязательно скажите выкладывать или нет....

Выкладывайте.

Док искал другой способ отбора предикторов - через построение дерева решений на генетике - мы совместно его тестиовали перед его уходом.

 
Aleksey Vyazmikin:

Да не понятно выражение "стремится попасть в какую либо область окрестности уже прошлых данных".

Бухать ненужно - с рынком сопьешься просто.

Данная коррекция назрела - не припомню, что бы так долго тянули на M15 луч ZZ вниз по каналу Дончианна (ценовой канал) - я со вчерашнего дня начал покупать. Да и индекс RGBI как то на коррекцию пошел, не смотря на укрепление вчера рубля - ЦБ не все облигации разместил на очередном аукционе.

Это означает что при появлении единички входная переменная трётся возле какого либо значения, скажем 100. Появилась единичка в выходной, а входная уже тут как тут окалачиваеться возле сотки, тем самым на истории начинаются формироваться уровни в которые входная переменная приходит чаще всего при появлении признака 1 в целевой и те кто приходит к своим уровням чаще, те круче. Ведь целевая у нас с заглядыванием в будущее. И на работе ООС если вход пришёл к сотке, знамо ожидай единички о которой мы узнаем только на следующем сигнале. Как то так....
 
Mihail Marchukajtes:
... Извини если объяснил сумбурно. Бухаю. Надо думать с утра не успел опомнится лося схватил и понесло меня :-)
Нуууу... я уж было по Вашим постам начал вникать в суть МО, а тут такое признание...))) 

Хотя, интересно, возможно я пойму МО с точки зрения пьяного человека и создам первую пьяную НС в мире?)))
 
Aleksey Vyazmikin:

Выкладывайте.

Док искал другой способ отбора предикторов - через построение дерева решений на генетике - мы совместно его тестиовали перед его уходом.

Ну это уже более серьёзный подход. Vtreat-же это исключительно пред обработка данных для последующего окончательного выбора входов уже в процессе оптимизации. У меня так...

Во вложении скрипт для R, а также прикладываю свой файл. Приколитесь, запустите его  и увидите насколько сильно он может сократить сырые данные. Там в скрипте нужно указать путь к фалй для считывания и путь куда записать рузельтат.

Файлы:
111.zip  2961 kb
 
Реter Konow:
Нуууу... я уж было по Вашим постам начал вникать в суть МО, а тут такое признание...))) 

Хотя, интересно, возможно я пойму МО с точки зрения пьяного человека и создам первую пьяную НС в мире?)))
Опыт сцуко не пропьёшь. В МО главное понять философию. Она очень важна для ответа на главный вопрос что могут сети, а чего нет. Не редко именно завышенные ожидания новичков ведут их к провалу и в по следстии к разочарованию в инструменте в целом. Не ждите от него сверх естественного и не будете слишком уж сильно разочарованы. Но как помощник лучше инструмента не найти.
Причина обращения: