Обсуждаются методы машинного обучения, включая SVM, GBM и xGBoost, а также вопросы обработки временных рядов и обучения моделей.

[Удален] 2016.02.15 14:17 #61

http://quantquant.com/viewtopic.php?f=7&t=1236

Vladimir Perervenko 2016.02.15 14:35 #62

zaskok3:
http://quantquant.com/viewtopic.php?f=7&t=1236

А эта ссылка к чему? Краткий коммент не помешал бы.

Например: Набор ссылок на обучающую литературу по R и Python.

Если по содержанию ссылок: Вы зачерпнули широкой сетью все подряд? Или какие то предпочтения есть? Из Питона наиболее интересно и заслуживает изучения и применения pyBrain. В нем реализованы сети которых нет в пакетах R. Не для дискуссии, не критика,так замечание по ходу.

Удачи

Машинное обучение в трейдинге: Пора конвертировать библиотеки на Вопросы от начинающих MQL5

Alexey Burnakov 2016.02.15 17:18 #63

Vladimir Perervenko:

1. Да.

2. Зачем ? Нужна единственная MT4R.dll которая является шлюзом для передачи данных в R и получения результатов обратно.

3. Ко всем существующим базам данных. Мало того и Майкрософт и Оракл интегрировали R в свои базы данных.

4. В R реализованы различные варианты взаимодействия с Матлабом от простого обмена мат файлами до исполнения функций Матлаба из R. Если у Вас наработки и опыт в этом направлении то с R Вы сможете реализовать отличную связку Матлаб-МТтерминал.

5. В R реализованы пакеты для всех направлений науки и техники причем с учетом самых последних достижений . Начните отсюда

6. Есть и не один. Наиболее распространенный ff.

А вообще я удивлен. Вы как в чистом поле. Просмотрите на этом сайте статьи 1 и 2 , многое будет не понятно, но представление о том как работает язык Вы получите.

Я заканчиваю и надеюсь завтра отправить на проверку вторую статью по глубокому обучению там будут приложены примеры экспертов.. Думаю, если будет интерес, написать несколько статей начального уровня (фильтрация, декомпозиция, прогнозирование и т.п.). Ну и конечно продолжить копать тему глубого обучения, тем более что Googl открыл для всех свою библиотеку TensorFlow . А есть и другие не менее интересные и перспективные (mxnet, pyBrain).

Если соберется коллектив энтузиастов можем организовать ветку пользователей языка R.

Удачи

Хорошие статьи! Спасибо. Мне нужно caret поизучать. Но вместо НС планирую попробовать SVM, GBM, xGBoost.

СанСаныч Фоменко 2016.02.15 17:40 #64

Alexey Burnakov:
Хорошие статьи! Спасибо. Мне нужно caret поизучать. Но вместо НС планирую попробовать SVM, GBM, xGBoost.

SVM, ada, randomforest. Все это после упражнений с этими пакетами в rattle. А после пакеты по отбору предикторов

Vladimir Perervenko 2016.02.15 18:04 #65

Alexey Burnakov:
Хорошие статьи! Спасибо. Мне нужно caret поизучать. Но вместо НС планирую попробовать SVM, GBM, xGBoost.

Пробуйте все.

Мои любимые randomForest в различных модификациях (главное преимущество - не требует препроцессинга входных данных. А также ada - очень высокий показатель качества. Обе имеют два недостатка - очень долго обучаются и сильно склонны к переобучению.

Это не значит, что не нужно их использовать, просто нужно помнить об этих неприятностях.

Удачи

нейронная сеть и входы Машинное обучение в трейдинге: Bayesian regression - Делал

Alexey Burnakov 2016.02.15 18:17 #66

СанСаныч Фоменко:
SVM, ada, randomforest. Все это после упражнений с этими пакетами в rattle. А после пакеты по отбору предикторов

Сам Саныч, я уже довольно с этими пакетами наупражнялся и на работе. ))) Только xGBoost еще не трогал.

Alexey Burnakov 2016.02.16 10:57 #67

Vladimir Perervenko:

Пробуйте все.

Мои любимые randomForest в различных модификациях (главное преимущество - не требует препроцессинга входных данных. А также ada - очень высокий показатель качества. Обе имеют два недостатка - очень долго обучаются и сильно склонны к переобучению.

Это не значит, что не нужно их использовать, просто нужно помнить об этих неприятностях.

Удачи

У меня к вам появился вопрос по статье 1. Я вижу по графику эмуляции торговли, что алгоритм совершает сделки на каждом баре, так?

И еще один вопрос. При обучении вы подавали машине данные также с каждого бара?

The central point that differentiates time-series problems from most other statistical problems is that in a time series, observations are not mutually independent. Rather a single chance event may affect all later data points. This makes time-series analysis quite different from most other areas of statistics.

Because of this nonindependence, the true patterns underlying time-series data can be extremely difficult to see by visual inspection. Anyone who has looked at a typical newspaper chart of stock-market averages sees trends that seem to go on for weeks or months. But statisticians who have studied the subject agree that such trends occur with essentially the same frequency one would expect by chance, and there is virtually no correlation between one day's stock-market movement and the next day's movement. If there were such a correlation, anybody could make money in the stock market simply by betting that today's trend will continue tomorrow, and it's simply not that easy. In fact, cumulating nearly any series of random numbers will yield a pattern that looks nonrandom.

Из: http://node101.psych.cornell.edu/Darlington/series/series1.htm

Дело, как вы, я предполагаю, понимаете в том, что прямолинейный подход, в котором все точки временного ряда участвуют в обучении (и тестировании) создают взаимнозависимые наблюдения, что одним махом перечеркивает валидность выводов о найденных "закономерностях". Проще говоря, результатам доверять нельзя, даже если все остальное сделано правильно. Поэтому создание из временного ряда выборки наблюдений, которая не нарушает статистические предположения - архиважно. Очень часто в популярных источниках этот шаг попросту игнорируется, а последствия самые плачевные. Машина не обучится закономерностям.

Обсуждение статьи "Машинное обучение Обсуждение статьи "Случайные леса торговая стратегия на базе

Vladimir Perervenko 2016.02.16 20:30 #68

Alexey Burnakov:

У меня к вам появился вопрос по статье 1. Я вижу по графику эмуляции торговли, что алгоритм совершает сделки на каждом баре, так?

И еще один вопрос. При обучении вы подавали машине данные также с каждого бара?

Из: http://node101.psych.cornell.edu/Darlington/series/series1.htm

Дело, как вы, я предполагаю, понимаете в том, что прямолинейный подход, в котором все точки временного ряда участвуют в обучении (и тестировании) создают взаимнозависимые наблюдения, что одним махом перечеркивает валидность выводов о найденных "закономерностях". Проще говоря, результатам доверять нельзя, даже если все остальное сделано правильно. Поэтому создание из временного ряда выборки наблюдений, которая не нарушает статистические предположения - архиважно. Очень часто в популярных источниках этот шаг попросту игнорируется, а последствия самые плачевные. Машина не обучится закономерностям.

Добрый день.

что алгоритм совершает сделки на каждом баре??

Нет. Алгоритм совершает сделки по сигналам полученным на последнем сформированном баре. Может я не понял вопрос?

И еще один вопрос. При обучении вы подавали машине данные также с каждого бара?

Это я совсем не понял. Может поясните? Я попробую ответить.

Удачи

Страшенные проблемы с написанием пробой утреннего флета Как заставить индикатор FX5_Divergence

Vladimir Perervenko 2016.02.16 20:34 #69

Alexey Burnakov:

У меня к вам появился вопрос по статье 1. Я вижу по графику эмуляции торговли, что алгоритм совершает сделки на каждом баре, так?

И еще один вопрос. При обучении вы подавали машине данные также с каждого бара?

Из: http://node101.psych.cornell.edu/Darlington/series/series1.htm

Дело, как вы, я предполагаю, понимаете в том, что прямолинейный подход, в котором все точки временного ряда участвуют в обучении (и тестировании) создают взаимнозависимые наблюдения, что одним махом перечеркивает валидность выводов о найденных "закономерностях". Проще говоря, результатам доверять нельзя, даже если все остальное сделано правильно. Поэтому создание из временного ряда выборки наблюдений, которая не нарушает статистические предположения - архиважно. Очень часто в популярных источниках этот шаг попросту игнорируется, а последствия самые плачевные. Машина не обучится закономерностям.

В статье на которую Вы ссылаетесь речь идет о регрессии. Мы занимаемся классификацией. Это две значительные разницы..

И все равно я не понял Ваш вопрос.

Удачи

Alexey Volchanskiy 2016.02.16 21:08 #70

Vladimir Perervenko:

В статье на которую Вы ссылаетесь речь идет о регрессии. Мы занимаемся классификацией. Это две значительные разницы..

И все равно я не понял Ваш вопрос.

Удачи

Попутный вопрос всем, кто в дискуссии. Вы работаете с тиковыми данными? Я давно отошел от анализа баров, работаю исключительно на методах DSP

Исследования в мат. пакетах - страница 7