Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 1908

 
Rorschach:

ок буду знать.

Вообще должны быть все входы полезны, у меня при снижении числа входов до 80 результат сильно ухудшается. Это реальная система, возможно там используются машки, зигзаги, не знаю, какой их период тоже не известно. Сеть сама это все восстанавливает. Если есть гугл драйв могу скинуть мой вариант поиграться.

Интерес еще есть? Что бы перемешать примеры придеться повозиться.

Ну во первых там куча лагов это видно не вооружённым глазом. Подготовьте файл я прогоню его....
 
Aleksey Nikolayev:

Вроде бы, тот же форекспростулз что и у вас, взятый из виджета инвестингсома.

Да, обшибся) Видимо глюки это все при парсинге, или на данных где чтение идет.

Нормализация вряд ли будет удобной. По хорошему нужны архивные новостные данные в терминале, штатная возможность их загрузки и сервис работы с ними. Не думаю что архивов нет) Но судя по позиции создателей, пока юзеры свое слово не скажут, что типа нужно, не стронется, а если и стронется, то сперва в платном варианте.)

 
Mihail Marchukajtes:
Ну во первых там куча лагов это видно не вооружённым глазом. Подготовьте файл я прогоню его....

у сеток нет памяти поэтому надо лаги подавать

Файлы:
data.csv  262 kb
 
Rorschach:

у сеток нет памяти поэтому надо лаги подавать

По мнению ВТРИТА ни один из входов не имеет отношение к целевой увы. Вопрос закрыт.
 
Mihail Marchukajtes:
По мнению ВТРИТА ни один из входов не имеет отношение к целевой увы. Вопрос закрыт.

А он может все входы использовать, меньше 100 входов никак нельзя

при 50 входах лучшая ошибка это 0.5


 
Rorschach:

А он может все входы использовать, меньше 100 входов никак нельзя

при 50 входах лучшее это 50%


Насколько я понял в ходе его эксплуатации он смотрит каждый столбик по отдельности на предмет формирования уровней по отношению к целевой, каждому столбику присваеваеться коэфицент. По сути он сравнивает столбики относительно друг друга по отношению к целевой в Вашем случай ни один из столбиков не смог преодолеть порог выше единице всё столбики показали фальше. Я сейчас пишу статью как раз таки о пред обработке данный и там много что интерессного. Одно из правил гласит столбик должен кореллировать с целевой и НЕ коррелировать с другими столбиками, а у вас они походу имеют очень большую корреляцию между собой тем самым становясь прсото бесполезными. Погодите я проверю ещё кое что....
 
Mihail Marchukajtes:
Насколько я понял в ходе его эксплуатации он смотрит каждый столбик по отдельности на предмет формирования уровней по отношению к целевой, каждому столбику присваеваеться коэфицент. По сути он сравнивает столбики относительно друг друга по отношению к целевой в Вашем случай ни один из столбиков не смог преодолеть порог выше единице всё столбики показали фальше. Я сейчас пишу статью как раз таки о пред обработке данный и там много что интерессного. Одно из правил гласит столбик должен кореллировать с целевой и НЕ коррелировать с другими столбиками, а у вас они походу имеют очень большую корреляцию между собой тем самым становясь прсото бесполезными. Погодите я проверю ещё кое что....

Тут не совсем стандартная ситуация. Обычно берут какие нибуть машки осцилляторы и подают в сеть. Эти индикаторы для расчета используют некоторое количество прошлых баров в зависимости от их периодов. В моем случае сеть сначала считает эти индикаторы и потом их использует для выдачи ответа, поэтому ей нужно знать прошлые значения цен.

 
Rorschach:

Тут не совсем стандартная ситуация. Обычно берут какие нибуть машки осцилляторы и подают в сеть. Эти индикаторы для расчета используют некоторое количество прошлых баров в зависимости от их периодов. В моем случае сеть сначала считает эти индикаторы и потом их использует для выдачи ответа, поэтому ей нужно знать прошлые значения цен.

У меня грязный файл состоит из 7700 столбиков где беру 24 лига, так что не продолжайте, а лучше смотрите сюда. Вот ваш файл

А вот мой

В чём разница???? Томить не буду. При анализе главных компонент, когда каждый столбик это своя система координат, важно что бы они могли групироватся, когда точки из разных столбиков могли бы быть отложены на одной общей для них системе координат. Интепритация простая. Чем больше вертикальных и горизонтальных векторов тем круче. У вас же это тупо равномерное пятно.

 
Mihail Marchukajtes:

У меня грязный файл состоит из 7700 столбиков где беру 24 лига, так что не продолжайте, а лучше смотрите сюда. Вот ваш файл

А вот мой

В чём разница???? Томить не буду. При анализе главных компонент, когда каждый столбик это своя система координат, важно что бы они могли групироватся, когда точки из разных столбиков могли бы быть отложены на одной общей для них системе координат. Интепритация простая. Чем больше вертикальных и горизонтальных векторов тем круче. У вас же это тупо равномерное пятно.

Если хотите сжать информацию, тогда уж сначала проверить на автокорреляцию, и можно смело оставить только 1 вход, только сеть работать не будет, потому что памяти нету.

 
Rorschach:

Если хотите сжать информацию, тогда уж сначала проверить на автокорреляцию, и можно смело оставить только 1 вход, только сеть работать не будет, потому что памяти нету.

Память для сети не самое важное, она как раз таки обеспечивается лагами а вот качество разделения классов (если мы говорим про классификацию) это очень важно. Нужно получить такой набор данных который бы не имел противоречий и классы были бы сгрупированы между собой. Всё это ведёт к качественному разделению. Я прогнал Ваш файл в раттле (графическая оболочка в Р) там есть метод опорных векторов и итогом было 65% обоощения. То есть если набор откровенное Г то в тоге рыбы нет будет. Но эти методы не требуют больших датасетов. Возможно Вы используете такую конфигурацию ИИ которая используя весь набор может получить высокую оценку обучения, но это как правило притянуто за уши, не более.
Причина обращения: