Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 365

 
elibrarius:

Удаление кореллированных входных я уже сделал, просто думаю, как бы еще улучшить входы.

Так вот с Вами я согласен, что корелляция с целевой должна быть, потому и хочу в добавок удалять самые некореллированные с целевой входы, например с Ккорр<0,5 или 0,3. Это должно ускорить процесс обучения, не сильно ухудшив качество. Но есть предположение, что придется удалить все входы )))

На использованных входах (взяты случайные из тех. индикаторов), пока что корелляции с целевой не нашел, ошибка обучения = 0,44, т.е. почти монетка. Ну и баланс идет вниз.


ни в коем случае не должно быть корреляции с целевой, где такое написано вообще? какой это имеет смысл? Если вы имеете корреляцию 1 с целевой то вы знаете будущее и нейросеть вам не нужна
 
Maxim Dmitrievsky:

ни в коем случае не должно быть корреляции с целевой, где такое написано вообще? какой это имеет смысл? Если вы имеете корреляцию 1 с целевой то вы знаете будущее и нейросеть вам не нужна


Все МО основано на том, что входящие переменные должны коррелировать с выходной переменной.

Иначе нет смысла ВО ВСЕХ моделях МО.

В Data Mining ВО ВСЕХ МОДЕЛЯХ ОТБОРА ПЕРЕМЕННЫХ ДЛЯ МОДЕЛИ реализован механизм максимальной корреляции входящей переменной и исходящей:

процедура Forward Selection (прямой отбор),
процедура Backward Elimination (обратное исключение),
процедура Stepwise,
процедура Best Subsets (лучшие подмножества).
 
Дмитрий:


Все МО основано на том, что входящие переменные должны коррелировать с выходной переменной.

Иначе нет смысла ВО ВСЕХ моделях МО.

В Data Mining ВО ВСЕХ МОДЕЛЯХ ОТБОРА ПЕРЕМЕННЫХ ДЛЯ МОДЕЛИ реализован механизм максимальной корреляции входящей переменной и исходящей:

процедура Forward Selection (прямой отбор),
процедура Backward Elimination (обратное исключение),
процедура Stepwise,
процедура Best Subsets (лучшие подмножества).

коррелировать в смысле входные и выходные векторы (кривые) должны коррелировать или корреляция просто означает зависимость выходной переменной от входной, в общем смысле?
 
Maxim Dmitrievsky:

коррелировать в смысле входные и выходные векторы (кривые) должны коррелировать или корреляция просто означает зависимость выходной переменной от входной, в общем смысле?


Зависимость - частный случай корреляции. Если две переменные зависят, то корреляция точно есть. Если корреляция есть, то не обязательно есть зависимость.

Методов выявления зависимости в статистических моделях нет. Есть только надежда, что выявленная корреляция между набором входящих переменных и выходной переменной является зависимостью.

Поэтому, переменные должны коррелировать.

 
Дмитрий:


Зависимость - частный случай корреляции. Если две переменные зависят, то корреляция точно есть. Если корреляция есть, то не обязательно есть зависимость.

Методов выявления зависимости в статистических моделях нет. Есть только надежда, что выявленная корреляция между набором входящих переменных и выходной переменной является зависимостью.

Поэтому, переменные должны коррелировать.


а если обратная корр, то это уже не зависимость что-ли? ) и НС затупит при таком подходе

Аллилуйя.. подаем зигзаг на вход и зигзаг на выход с смещением.. корреляция почти идеальная, а толку? )

 
Maxim Dmitrievsky:

а если обратная корр, то это уже не зависимость что-ли? ) и НС затупит при таком подходе


Отсутствие корреляции это когда коэффициент корреляции равен 0.

Как можно построить модель, если входящая и исходящая вообще не коррелируют?

 
Дмитрий:


Отсутствие корреляции это когда коэффициент корреляции равен 0.

Как можно построить модель, если входящая и исходящая вообще не коррелируют?


Да потому что корреляция входов и выходов вообще не важна, когда модель ищет закономерности в наборе предикторов... Это же противоречие - удалять коррелируемые между собой входы но искать коррелированные входы к выходам.. )) Т.е. как  МИНИМУМ у нас будет один вход коррелирован с выходом, тогда все остальные входы нам придется удалить, т.к. они тоже коррелированы со выходом, и, соответственно с остальными входами.. круто, да?
 
Maxim Dmitrievsky:

Да потому что корреляция входов и выходов вообще не важна, когда модель ищет закономерности в наборе предикторов... Это же противоречие - удалять коррелируемые между собой входы но искать коррелированные входы к выходам.. )) Т.е. как  МИНИМУМ у нас будет один вход коррелирован с выходом, тогда все остальные входы нам придется удалить, т.к. они тоже коррелированы со выходом, и, соответственно с остальными входами.. круто, да?


Нет, не круто.

Если у вас первая переменная коррелирована с исходящей с коэффициентом, например, 0.7, а вторая с коэффициентом 0.65, то это совсем не значит, что эти две переменные сильно коррелированы между собой.

А теперь представим, что первая с 0.7, а вторая с коэффициентом -0.69.

 
Дмитрий:


Нет, не круто.

Если у вас первая переменная коррелирована с исходящей с коэффициентом, например, 0.7, а вторая с коэффициентом 0.65, то это совсем не значит, что эти две переменные сильно коррелированы между собой.

А теперь представим, что первая с 0.7, а вторая с коэффициентом -0.69.


А если еще представить, что корреляция очень своеобразно определяет "похожесть"... я бы не очень-то ей и доверял

Мы строим точную выскотехнологичную нейросеть и руководствуемся корреляцией при выборе предикторов? как-то это ну маленько н правильно что-ли.. но все это "по моему".. )

 
Maxim Dmitrievsky:

А если еще представить, что корреляция очень своеобразно определяет "похожесть"... я бы не очень-то ей и доверял


Тогда второй вариант - суй в НС все, что есть. Но есть два НО:

1. надейся, что некоррелированные переменные не ухудшат качество модели (для регрессии такое есть).

2. жертвуй размерностью и временем. 

Причина обращения: