Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 1042

 

Тюююююю.... да где это видано было чтоб ветка опускалась ниже первой страницы????? Да.... запустили вы её ребята... запустили. В месте с тем у меня всё хорошо и полученные результаты вполне обнадёживают и всё благодаря случайно допущенной ошибки :-)

Было так.....Как пример...



А стало вот так.... Кто ни будь может сказать произошло ли улучшение данных или нет????

Действительной вопросов очень много. Как интерпретировать график главных компонент????? И всё таки вопрос Эти два набора данных взяты за один и тот же период времени. Целевая одна и та же, но сохранение предикторов было сделано двумя разными способами. Итак. Ваш выход статисты, данная задачка именно для Вас!!!!!

Какой из приведённых наборов данных лучше??? Первый или второй. Ваше мнение господа!!!!!

А потом я выскажусь...... Ладушки???

 

Не осилил и 2-х страниц этой темы.

Просто выскажу свое мнение. И так Машинное обучение это набор статистики по инструменту, анализ и уже сам алгоритм по результату проделанной работы, но... Есть одно важное замечание, никакой алгоритм не гарантирует, что если соблюсти все условия, то вы получите нужный результат, а это значит сколько бы вы данных не анализировали и как бы не усложняли алгоритмы принятия решения, во всем этом будет присутствовать вероятность предполагаемого исхода.

Именно вероятность вы торгуете, в следствии чего вам надо искать исход более высоких коэффициентов вероятности. Сам же рынок однообразен, исходя из моего анализа (не точного, но был не точен как для лонгов, так и шортов), рынок за один и тот же временной интервал дает приблизительно одинаковое(49%/51% или 51%/49%) количество профитных сделок в обе стороны.

И так, алгоритм принятия решения должен отталкиваться от наиболее высокой оценки(качественной ) вероятности исхода с доп фильтрами на ваше усмотрение.

 
Mihail Marchukajtes:

Тюююююю.... да где это видано было чтоб ветка опускалась ниже первой страницы????? Да.... запустили вы её ребята... запустили. В месте с тем у меня всё хорошо и полученные результаты вполне обнадёживают и всё благодаря случайно допущенной ошибки :-)

Было так.....Как пример...



А стало вот так.... Кто ни будь может сказать произошло ли улучшение данных или нет????

Действительной вопросов очень много. Как интерпретировать график главных компонент????? И всё таки вопрос Эти два набора данных взяты за один и тот же период времени. Целевая одна и та же, но сохранение предикторов было сделано двумя разными способами. Итак. Ваш выход статисты, данная задачка именно для Вас!!!!!

Какой из приведённых наборов данных лучше??? Первый или второй. Ваше мнение господа!!!!!

А потом я выскажусь...... Ладушки???

Михайло до PCA добрался.. нафига, руки чешутся? )

график главных компонент надо интерпретировать в ортогональном базисе :D

красные это типа орты предикторов, а цифры что обозначают?

 
Maxim Dmitrievsky:

Михайло до PCA добрался.. нафига, руки чешутся? )

график главных компонент надо интерпретировать в ортогональном базисе :D

Ну так и какой из них лучше???

 
Mihail Marchukajtes:

Ну так и какой из них лучше???

ну второй, 55%

 
Maxim Dmitrievsky:

ну второй, 55%

На графике главных компонент(первый график) нету никаких 55%. 55% это график кластеризации на котором в обоих случаях данные представляют две хорошо разделимые области. Одна лучше одна хуже и всетаки вернёмся к первому графику. Почему нижний лучше чем верхний????

Для это нужно знать как их интерпретировать!!!!

 
Mihail Marchukajtes:

На графике главных компонент(первый график) нету никаких 55%. 55% это график кластеризации на котором в обоих случаях данные представляют две хорошо разделимые области. Одна лучше одна хуже и всетаки вернёмся к первому графику. Почему нижний лучше чем верхний????

Для это нужно знать как их интерпретировать!!!!

ну если цифры это точки то на втором дисперсия по 2-м компонентам ниже чем на 1-м, не?

http://setosa.io/ev/principal-component-analysis/

покрути графики мышкой и почитай, сразу все понятно станет

 
Maxim Dmitrievsky:

ну если цифры это точки то на втором дисперсия по 2-м компонентам ниже чем на 1-м, не?

http://setosa.io/ev/principal-component-analysis/

Согласен!!!! Но это не всё... Оказывается второй график лучше по причине наличия таких векторов которые максимально приближены к нулевым осям. В этом примере это не так видно, но сейчас стали попадатся такие наборы данных у который вектора компонент совпадают с нулевыми осями и делят поле на ровные 4 квадрата. В первом случае оси компонент разбросаны по диоганалям между нулями тогда как на втором рисунке есть такие вектора компонент которые максимально сближены к нулевым линиям. Зная наименование предиктора тренируем оптимизатор до тех пор пока во входах будут именно те предикторы которые формируют вектор компонент максимально приближенный к нулевой оси и не важно в какую сторону. Опять таки это мой ИМХО!!! Поэтому и хотел уточнить насколько я прав!!!!

 
Mihail Marchukajtes:

Согласен!!!! Но это не всё... Оказывается второй график лучше по причине наличия таких векторов которые максимально приближены к нулевым осям. В этом примере это не так видно, но сейчас стали попадатся такие наборы данных у который вектора компонент совпадают с нулевыми осями и делят поле на ровные 4 квадрата. В первом случае оси компонент разбросаны по диоганалям между нулями тогда как на втором рисунке есть такие вектора компонент которые максимально сближены к нулевым линиям. Зная наименование предиктора тренируем оптимизатор до тех пор пока во входах будут именно те предикторы которые формируют вектор компонент максимально приближенный к нулевой оси и не важно в какую сторону. Опять таки это мой ИМХО!!! Поэтому и хотел уточнить насколько я прав!!!!

Твой оптимизатор нелинейный а PCA линейный, хз как ты там че поймешь

 
Maxim Dmitrievsky:

Твой оптимизатор нелинейный а PCA линейный, хз как ты там че поймешь

Очень просто. Из графика РСА я выясняю какие предикторы лежат ближе всего к нулевым осям. И сторою модели до тех пор пока на входе у неё будут именно этии предиктора\ы. Как правила в течении 2-3 оптимизаций они выпадают, такие модели будут устойчивы к данным и максимально пилят текущую область данных. ИМХо естественно :-)

Причина обращения: