Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 3178

 
Maxim Dmitrievsky #:
Предлагается спросить разработчиков в их телеге, ибо неведомо мне что они творят 

Спросите, раз не понимаете.

Более того, некоторые бустинги делают квантование предиктора после каждого сплита, квантуя остаток.

Ну и не только я использую это, участники конкурсов так же иногда упоминают работу в этом направлении.

В общем, насильно кормить больше не буду.

 
Aleksey Vyazmikin #:

Спросите, раз не понимаете.

Более того, некоторые бустинги делают квантование предиктора после каждого сплита, квантуя остаток.

Ну и не только я использую это, участники конкурсов так же иногда упоминают работу в этом направлении.

В общем, насильно кормить больше не буду.

а зачем мне спрашивать, если перевод из флотов в инты нужен, в основном, для ускорения на очень больших данных

плюшкой может идти небольшая калибровка модели в лучшую или худшую сторону, как повезет

просто ответят они вам то же самое, поэтому, наверное, боитесь спросить, потому что это обесценит все ваши многолетние труды :)

это копошение в нижнем белье алгоритма
 
Maxim Dmitrievsky #:
Узрите, ибо если не дан вам паттерн в исконном ряду, то тропа Гильбертова не приведет вас к цели заветной. В бесовщину превратится ваш потуг, и заклание бесславное обрящете, вместо кущ райских.

😁😁

 

Я спрашивал у разрабов буста, что делать с мультиколлинеарностью и отбором признаков (препроцессингом).

На что получил однозначный ответ: чувак, просто забей :)

 
Maxim Dmitrievsky #:

а зачем мне спрашивать, если перевод из флотов в инты нужен, в основном, для ускорения на очень больших данных

плюшкой может идти небольшая калибровка модели в лучшую или худшую сторону, как повезет

просто ответят они вам то же самое, поэтому, наверное, боитесь спросить, потому что это обесценит все ваши многолетние труды :)

Как мои труды могут обесцениваться от ответа на вопрос, если я их оцениваю по результату?

Да, результат не супер в плане прироста показателей метрик, но он есть, в том числе в других проявлениях.

К примеру есть выборки, где без предобработки по моему методу мне вообще не удавалось получить прибыльной модели на новых данных.

 
Maxim Dmitrievsky #:

Я спрашивал у разрабов буста, что делать с мультиколлинеарностью и отбором признаков (препроцессингом).

На что получил однозначный ответ: чувак, просто забей :)

А если признаков миллиард,  тоже забить? Или все таки надо делать отбор не коррелированых 
 
mytarmailS #:
А если признаков миллиард,  тоже забить? Или все таки надо делать отбор не коррелированых 
По желанию 
 
Maxim Dmitrievsky #:
По желанию 
Скорей по необходимости,  нужно фильтровать,  без вариантов
 
Maxim Dmitrievsky #:

Я спрашивал у разрабов буста, что делать с мультиколлинеарностью и отбором признаков (препроцессингом).

На что получил однозначный ответ: чувак, просто забей :)

Там есть функционал, который вообще мало кто обсуждает, судя по информации о реальных примерах его применения.

К примеру - возможность группировки предикторов и раздача им весов. В этом я так же вижу потенциал для улучшения модели, но мне не сподручно тут экспериментировать - требуется много перебора.

Да и не факт, что тот, кто изначально держал весь проект у себя в голове ещё там работает над ним, вполне возможно, что остались соратники и другие лица, которые улучшают сам алгоритм по скорости исполнения и правят баги. Ну и мелкие фишечки появляются иногда.

 
mytarmailS #:
Скорей по необходимости,  нужно фильтровать,  без вариантов
Проще, наверное, изначально не делать миллиард признаков 
Причина обращения: