Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 1697
Вы упускаете торговые возможности:
- Бесплатные приложения для трейдинга
- 8 000+ сигналов для копирования
- Экономические новости для анализа финансовых рынков
Регистрация
Вход
Вы принимаете политику сайта и условия использования
Если у вас нет учетной записи, зарегистрируйтесь
Удивительно, а почему Вы не пользуетесь vtreat-ом для R? Он как раз таки выявляет уровни во входных данных по отношению к целевой и тем самым отбирает те предикты которые для целевой значимы. Помимо классификации там есть вариант и для прогнозирования. Если честно да же и не знаю что бы я без него делал....
Я не знаю принципа отбора предикторов этим инструментом, поэтому и не использую.
Вы знаете этот принцип?
Видимо просто сетка по
либо равномерная но шкале, либо по количеству примеров (перцентили)
Если так, то плохи дела - этого недостаточно.
Пока мой сравнительный эксперимент не завершился - обнаружил ошибку при подготовки данных и пришлось 8 выборок снова ставить на обучение.
Думаю, что к концу недели будет результат, который тут опубликую.
И, буду делать свой "переборщик" условных листьев по этим предикторам (по методу, что я описывал ранее) - с контролем результатов (разной метрики) на каждом шаге.
Рынок описать весь не получится одной моделью, поэтому я буду искать устойчивые закономерности, объединяя их в ТС, и меня не смущает, что часть "пространства" останется неопределенной.
Я не знаю принципа отбора предикторов этим инструментом, поэтому и не использую.
Вы знаете этот принцип?
Ну если верить словам Дока и если я правильно его понял для классификации он определяет формируется ли уровни на входной переменой в зависимости от результата целевой. Как я это вижу. Для всех единичек целевой значимый вход стремится попасть в область окрестности уровней, коих тоже может быть несколько. Другими словами если в целевой 100 единичек, то при появлении единички важный вход стремится попасть в какую либо область окрестности уже прошлых данных. В целевой единичек 100, а в важном входе есть 30 областей окрестности данных, но когда бы не появилась единичка в целевой важный вход обязательно придёт в одну из областей окрестностей. И чем больше он туда попадает при появлении единички тем он важней. Там по сути идёт сравнения по отношению к общему набору. То есть результатом работы данного пакета будет выбор тех переменных которые приходили чаще в свои области чем другие. Извини если объяснил сумбурно. Бухаю. Надо думать с утра не успел опомнится лося схватил и понесло меня :-)
Да не понятно выражение "стремится попасть в какую либо область окрестности уже прошлых данных".
Бухать ненужно - с рынком сопьешься просто.
Данная коррекция назрела - не припомню, что бы так долго тянули на M15 луч ZZ вниз по каналу Дончианна (ценовой канал) - я со вчерашнего дня начал покупать. Да и индекс RGBI как то на коррекцию пошел, не смотря на укрепление вчера рубля - ЦБ не все облигации разместил на очередном аукционе.
Добавлю с другой стороны. Втрит вычисляет формирует ли целевая уровни во входных данных. И в тех данных где этих уровней больше и они более конкретизированны, те данные и сильнее. В ообще скрипт для R могу выложить. Он прозвидение Дока я только под себя его запилил. Чтоб результат получать в удобном для меня формате. ФОРМАТЕ ОПТИМИЗАТОРА РЕШЕТОВА УУУУАХАХАХАХА.... Там уже сами допилите под себя. Только обязательно скажите выкладывать или нет....
Выкладывайте.
Док искал другой способ отбора предикторов - через построение дерева решений на генетике - мы совместно его тестиовали перед его уходом.
Да не понятно выражение "стремится попасть в какую либо область окрестности уже прошлых данных".
Бухать ненужно - с рынком сопьешься просто.
Данная коррекция назрела - не припомню, что бы так долго тянули на M15 луч ZZ вниз по каналу Дончианна (ценовой канал) - я со вчерашнего дня начал покупать. Да и индекс RGBI как то на коррекцию пошел, не смотря на укрепление вчера рубля - ЦБ не все облигации разместил на очередном аукционе.
... Извини если объяснил сумбурно. Бухаю. Надо думать с утра не успел опомнится лося схватил и понесло меня :-)
Выкладывайте.
Док искал другой способ отбора предикторов - через построение дерева решений на генетике - мы совместно его тестиовали перед его уходом.
Ну это уже более серьёзный подход. Vtreat-же это исключительно пред обработка данных для последующего окончательного выбора входов уже в процессе оптимизации. У меня так...
Во вложении скрипт для R, а также прикладываю свой файл. Приколитесь, запустите его и увидите насколько сильно он может сократить сырые данные. Там в скрипте нужно указать путь к фалй для считывания и путь куда записать рузельтат.
Нуууу... я уж было по Вашим постам начал вникать в суть МО, а тут такое признание...)))