Данные содержат много лагов и корреляции между столбиками, что снижает качество модели

Mihail Marchukajtes 2020.07.23 11:46 #19071

Rorschach:

ок буду знать.

Вообще должны быть все входы полезны, у меня при снижении числа входов до 80 результат сильно ухудшается. Это реальная система, возможно там используются машки, зигзаги, не знаю, какой их период тоже не известно. Сеть сама это все восстанавливает. Если есть гугл драйв могу скинуть мой вариант поиграться.

Интерес еще есть? Что бы перемешать примеры придеться повозиться.

Ну во первых там куча лагов это видно не вооружённым глазом. Подготовьте файл я прогоню его....

Valeriy Yastremskiy 2020.07.23 11:47 #19072

Aleksey Nikolayev:

Вроде бы, тот же форекспростулз что и у вас, взятый из виджета инвестингсома.

Да, обшибся) Видимо глюки это все при парсинге, или на данных где чтение идет.

Нормализация вряд ли будет удобной. По хорошему нужны архивные новостные данные в терминале, штатная возможность их загрузки и сервис работы с ними. Не думаю что архивов нет) Но судя по позиции создателей, пока юзеры свое слово не скажут, что типа нужно, не стронется, а если и стронется, то сперва в платном варианте.)

Особенности языка mql5, тонкости Пожелания для МТ5 Bybit MT5

Rorschach 2020.07.23 11:53 #19073

Mihail Marchukajtes:
Ну во первых там куча лагов это видно не вооружённым глазом. Подготовьте файл я прогоню его....

у сеток нет памяти поэтому надо лаги подавать

Файлы:

data.csv 262 kb

Mihail Marchukajtes 2020.07.23 12:14 #19074

Rorschach:

у сеток нет памяти поэтому надо лаги подавать

По мнению ВТРИТА ни один из входов не имеет отношение к целевой увы. Вопрос закрыт.

Rorschach 2020.07.23 12:21 #19075

Mihail Marchukajtes:
По мнению ВТРИТА ни один из входов не имеет отношение к целевой увы. Вопрос закрыт.

А он может все входы использовать, меньше 100 входов никак нельзя

при 50 входах лучшая ошибка это 0.5

Mihail Marchukajtes 2020.07.23 12:33 #19076

Rorschach:

А он может все входы использовать, меньше 100 входов никак нельзя

при 50 входах лучшее это 50%

Насколько я понял в ходе его эксплуатации он смотрит каждый столбик по отдельности на предмет формирования уровней по отношению к целевой, каждому столбику присваеваеться коэфицент. По сути он сравнивает столбики относительно друг друга по отношению к целевой в Вашем случай ни один из столбиков не смог преодолеть порог выше единице всё столбики показали фальше. Я сейчас пишу статью как раз таки о пред обработке данный и там много что интерессного. Одно из правил гласит столбик должен кореллировать с целевой и НЕ коррелировать с другими столбиками, а у вас они походу имеют очень большую корреляцию между собой тем самым становясь прсото бесполезными. Погодите я проверю ещё кое что....

Почему нормальное распределение не Какое самое важное условие Парный трейдинг и мультивалютный

Rorschach 2020.07.23 12:43 #19077

Mihail Marchukajtes:
Насколько я понял в ходе его эксплуатации он смотрит каждый столбик по отдельности на предмет формирования уровней по отношению к целевой, каждому столбику присваеваеться коэфицент. По сути он сравнивает столбики относительно друг друга по отношению к целевой в Вашем случай ни один из столбиков не смог преодолеть порог выше единице всё столбики показали фальше. Я сейчас пишу статью как раз таки о пред обработке данный и там много что интерессного. Одно из правил гласит столбик должен кореллировать с целевой и НЕ коррелировать с другими столбиками, а у вас они походу имеют очень большую корреляцию между собой тем самым становясь прсото бесполезными. Погодите я проверю ещё кое что....

Тут не совсем стандартная ситуация. Обычно берут какие нибуть машки осцилляторы и подают в сеть. Эти индикаторы для расчета используют некоторое количество прошлых баров в зависимости от их периодов. В моем случае сеть сначала считает эти индикаторы и потом их использует для выдачи ответа, поэтому ей нужно знать прошлые значения цен.

период MAШКИ с минусовым Торговля спредами в Meta Индикатор Аруна

Mihail Marchukajtes 2020.07.23 12:56 #19078

Rorschach:

Тут не совсем стандартная ситуация. Обычно берут какие нибуть машки осцилляторы и подают в сеть. Эти индикаторы для расчета используют некоторое количество прошлых баров в зависимости от их периодов. В моем случае сеть сначала считает эти индикаторы и потом их использует для выдачи ответа, поэтому ей нужно знать прошлые значения цен.

У меня грязный файл состоит из 7700 столбиков где беру 24 лига, так что не продолжайте, а лучше смотрите сюда. Вот ваш файл

А вот мой

В чём разница???? Томить не буду. При анализе главных компонент, когда каждый столбик это своя система координат, важно что бы они могли групироватся, когда точки из разных столбиков могли бы быть отложены на одной общей для них системе координат. Интепритация простая. Чем больше вертикальных и горизонтальных векторов тем круче. У вас же это тупо равномерное пятно.

Как сделать большие круглые Тема для трейдеров. Индикаторы: USD AGAINST ALL

Rorschach 2020.07.23 14:29 #19079

Mihail Marchukajtes:

У меня грязный файл состоит из 7700 столбиков где беру 24 лига, так что не продолжайте, а лучше смотрите сюда. Вот ваш файл

А вот мой

В чём разница???? Томить не буду. При анализе главных компонент, когда каждый столбик это своя система координат, важно что бы они могли групироватся, когда точки из разных столбиков могли бы быть отложены на одной общей для них системе координат. Интепритация простая. Чем больше вертикальных и горизонтальных векторов тем круче. У вас же это тупо равномерное пятно.

Если хотите сжать информацию, тогда уж сначала проверить на автокорреляцию, и можно смело оставить только 1 вход, только сеть работать не будет, потому что памяти нету.

Mihail Marchukajtes 2020.07.23 14:43 #19080

Rorschach:

Если хотите сжать информацию, тогда уж сначала проверить на автокорреляцию, и можно смело оставить только 1 вход, только сеть работать не будет, потому что памяти нету.

Память для сети не самое важное, она как раз таки обеспечивается лагами а вот качество разделения классов (если мы говорим про классификацию) это очень важно. Нужно получить такой набор данных который бы не имел противоречий и классы были бы сгрупированы между собой. Всё это ведёт к качественному разделению. Я прогнал Ваш файл в раттле (графическая оболочка в Р) там есть метод опорных векторов и итогом было 65% обоощения. То есть если набор откровенное Г то в тоге рыбы нет будет. Но эти методы не требуют больших датасетов. Возможно Вы используете такую конфигурацию ИИ которая используя весь набор может получить высокую оценку обучения, но это как правило притянуто за уши, не более.

Сеть, состоящую из одного Нейронная сеть - вход Промывание мозгов: советники

Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 1908