Обсуждение статьи "Машинное обучение от Яндекс (CatBoost) без изучения Phyton и R" - страница 7

 
Aleksey Vyazmikin:

Здравствуйте.

Если речь идет о замене индикатора, то этому обучить можно, но если речь идет о прогнозе экстремумов, то это сделать уже гораздо сложней, но алгоритм CatBoost позволяет это сделать, если есть соответсвующие предикторы.

Хорошая оговорка про предикторы.. :)
До сих пор никому эта задача не далась...
Или далась, но о решении благоразумно молчат
 

Большое спасибо за эту замечательную статью и примеры кодов, но у меня проблема с запуском "_01_Train_All.bat",

scrrenshot как показано ниже:

Файлы в папке:


, не могли бы вы помочь разобраться в чем проблема, или какой-то шаг неправильно настроен?

Очень признателен за вашу любезную поддержку!

 
Di Wan:

Большое спасибо за эту замечательную статью и примеры кодов, но у меня проблема с запуском "_01_Train_All.bat",

scrrenshot как показано ниже:

Файлы в папке:


Не могли бы вы помочь выяснить, где проблема, или какой-либо шаг неправильно настроен?

Очень признателен за вашу любезную поддержку!

Вам необходимо открыть файлы exam.csv/test.csv/train.csv в программе для чтения файлов (например, EditPad Lite). Через поиск найдите и замените "inf" на 0, как альтернативу бесконечности. К сожалению, в некоторых показателях могут быть получены нечисловые результаты, но это редкость.
 

Для тех, кто не понял какие то описанные моменты по настройке и запуску, изложенные в статье, решил сделать видео ролик на примере EURUSD - смотрите с субтитрами(!)


 

Огромный объем работы и затраченного времени. Пора таки начать применять специализированные ЯП (R/Python/Julia и т.д). Они дают несравнимо большую свободу выбора и значительную экономию времени в разработке. 

Иначе удачи желаю в Вашем нелегком выборе.

 
Vladimir Perervenko #:

Огромный объем работы и затраченного времени. Пора таки начать применять специализированные ЯП (R/Python/Julia и т.д). Они дают несравнимо большую свободу выбора и значительную экономию времени в разработке. 

Иначе удачи желаю в Вашем нелегком выборе.

Действительно, объем работы был проделан большой, и когда это сейчас все автоматизировано, то времени на обучение все занимает уже не много и не нужно дополнительно учить ЯП (R/Python/Julia и т.д) и тратить на это годы жизни, а уже сейчас пользоваться доступным мощным инструментом для МО. В любом случае знать язык - это слишком мало для достижения результата - нужно уметь использовать его потенциал, библиотеки да и иметь соответствующее образование. В моем же случае мне удобней придумать свою идею и сделать всё так, как я это вижу, и возможно это уже придумано до меня, но я этого просто не знаю. К тому же сам процесс обучения без ЯП будет быстрей и его легко перенести на другие компьютеры для параллельного перебора данных без организации сложной инфраструктуры - достаточно просто bat файл разделить на нужное количество частей по числу машин, и не устанавливать везде пакеты и настройки для обучения - это сильно экономит время.

В итоге - для экспериментов, при глубоком знании набора аналитических инструментов и соответствующем образовании подойдут оптимально ЯП, а для конвейерной, быстрой и стабильной, мой метод будет лучше.

 

Алексей большое спасибо за статью. Отличная!

Где бы почитать мануал по Catboost на русском языге? Гугл и Яндекс только на английском предлагают, а с ним как то не очень (переводчик термены не очень переводит). 

Если бы подучить настройки то можно было бы покрутить параметры...

И ещё как строить диаграммы как у Вас на скринах?

 
Viktor Kudriavtsev #:

Алексей большое спасибо за статью. Отличная!

Где бы почитать мануал по Catboost на русском языге? Гугл и Яндекс только на английском предлагают, а с ним как то не очень (переводчик термены не очень переводит). 

Если бы подучить настройки то можно было бы покрутить параметры...

И ещё как строить диаграммы как у Вас на скринах?

Рад, что статья понравилась!

К сожалению Яндекс выкладывает всю информацию только на английском, смысл большинства параметров рассказывается в видео, что есть в статье, к тому же я отобрал наиболее эффективно влияющие на обучение и поместил их в скрипт " CB_Bat" - дал описание в статье. Лучше озаботиться созданием новых предикторов - это может качественно улучшить модель, кручение настроек модели - это часто смещение рандома в ту или иную сторону. Экспериментируете и придет понимание, какой параметр важен, а какой не очень.

Диаграммы строились в Excel.

Вот плейлист по CatBoost/
089. Мастер класс Решение задач классификации при помощи CatBoost – Никита Дмитриев
089. Мастер класс Решение задач классификации при помощи CatBoost – Никита Дмитриев
  • 2018.10.31
  • www.youtube.com
PyData Moscow, 13 октября 2018 г.Градиентный бустинг — метод машинного обучения, появление которого привело к прорыву в решении многих задач, включая поиск в...
 

Здравствуйте, при компиляции возникли ошибки


 

Я загружаю файлы (zip) и компилирую - все работает.