Обсуждается применение методов анализа данных и детекции аномалий

[Удален] 2023.07.25 18:20 #31561

Получается как про слона и мудрецов. В книге все есть, они требуют на пальцах сделать пересказ на форуме, чтобы понять, что это слон.

Aleksey Vyazmikin 2023.07.25 18:27 #31562

Aleksey Nikolayev #:

Там, в статье, на 10-й странице есть реализация в виде псевдокода. На предпоследней странице, в приложении, есть ссылки на реализацию на языке R и на данные, использованные в статье.

Псевдокод ссылается на формулы :)

Что касается кода на R - тут спасибо - пропустил. Я так понимаю, что там в виде кода функции, но сам код, такой как чтение из файла, закомментирован?

# --- Read in data --- 

# > arson = read.csv("arson.csv")
# > i = with(arson, day <= 731)
# > arson1 = arson[i,]
# > arson2 = arson[!i,]
# > arson2[,"day"] = arson2[,"day"] - 731

Пока не разобрался, как заставить это работать. У Вас получилось?

Aleksey Nikolayev #:

Как, в общих чертах, реализуете деревья решений на mql5? Через массивы или шаблоны?

Ранее не делал реализацию построения деревьев на MQL5 - тут больше опыта у Forester.

Однако, думаю, что кроме массивов использовал бы вектора и матрицы - с ними код быстрей получается. Ещё, раз требуется там полный перебор, как я понял, можно будет использовать OpenCL.

А вот что такое "шаблоны" в данном контексте - я не знаю :(

Раз есть код на R, то разумно в начале понять, есть в этом всём смысл или нет.

Выборка из статьи использует малое количество предикторов, у меня их на порядок больше и конечно они менее информативные по отдельности.

Вообще, мне интересно использования не просто для сравнения двух выборок, а для детекции аномалии в данных - думаю, что по этому пути надо идти.

Идея в том, что имеем группы листьев, пусть даже похожих, и если мы видим аномальное поведение одного предиктора, то просто отключаем все листья, которые его используют, при этом проверяем на корреляцию с листьями из группы. По идеи, при своевременной детекции, это позволит модели продолжить работу, пусть и с меньшей уверенностью.

Группировка листьев - требуются Считывание настроек советника из Есть ли закономерность в

[Удален] 2023.07.25 18:44 #31563

Работа с пердикторами - это сизифов труд и попытка понять вечную бесконечность. Вы их из одной кривульки уже столько неизвлекали, что хватит потомкам :) Алексей уже расщипил на атомы. Их просто должно быть достаточно. Всегда об этом говорил и мое мнение не изменилось.

Предложение метаквотам по разделу Когда кончатся эти мучения FOREX - Тенденции, прогнозы

Aleksey Nikolayev 2023.07.25 18:48 #31564

Aleksey Vyazmikin #:

Псевдокод ссылается на формулы :)

Что касается кода на R - тут спасибо - пропустил. Я так понимаю, что там в виде кода функции, но сам код, такой как чтение из файла, закомментирован?

Пока не разобрался, как заставить это работать. У Вас получилось?

Насколько понимаю, закомментированы команды для работы с R в интерактивной сессии. Сначала загружаете весь скрипт целиком, чтобы определить функции, а потом команды построчно, нажимая ввод после каждой. Это наверно что-то вроде стандарта в научных публикациях - опираться только на командную строку и избегать всяких сред типа Рстудио.

Aleksey Vyazmikin #:

Ранее не делал реализацию построения деревьев на MQL5 - тут больше опыта у Forester.

Однако, думаю, что кроме массивов использовал бы вектора и матрицы - с ними код быстрей получается. Ещё, раз требуется там полный перебор, как я понял, можно будет использовать OpenCL.

А вот что такое "шаблоны" в данном контексте - я не знаю :(

Раз есть код на R, то разумно в начале понять, есть в этом всём смысл или нет.

Выборка из статьи использует малое количество предикторов, у меня их на порядок больше и конечно они менее информативные по отдельности.

Вообще, мне интересно использования не просто для сравнения двух выборок, а для детекции аномалии в данных - думаю, что по этому пути надо идти.

Идея в том, что имеем группы листьев, пусть даже похожих, и если мы видим аномальное поведение одного предиктора, то просто отключаем все листья, которые его используют, при этом проверяем на корреляцию с листьями из группы. По идеи, при своевременной детекции, это позволит модели продолжить работу, пусть и с меньшей уверенностью.

Для краткости обозвал шаблонами одновременно дерево CTree из коллекции данных и шаблоны классов, которые вроде тоже неизбежны.

Детекция аномалий там значится в целях - ищется же где аномально часты пожары.

PS. Когда-то писал уже вам про использование распределения Пуассона, а здесь это развито до рабочего кода.

Нужно ли делать расширенный Как правильно упаковать индикатор Учёба. Классы. Нужна помощь.

mytarmailS 2023.07.25 19:03 #31565

Maxim Dmitrievsky #:
Получается как про слона и мудрецов. В книге все есть, они требуют на пальцах сделать пересказ на форуме, чтобы понять, что это слон.

надо просто нормально на "высоком уровне" обяснить сначала для чего это все , потом просто по пунктам действия , а ты сразу начал с часностей по "низкому уровню" , с терминов , без всякой структыры..

Никто толком ничего не понял и понять не мог в принцепе..

Это как выйти на сцену и 10 раз сказать абра-кадабра , а потом сказать - кто не понял читайте книжку

естестевенно никто ничего не понял, естестевенно никто ничего читать не будет..

в R тут по казуалу пакетов штук 100 , я хз вообще куда смотреть.. какай это должен быть кластер алгоритмов?

CRAN Task View: Causal Inference

cran.r-project.org

Overview

Машинное обучение: теория и Конец пакета. Требуется специалист с хорошим

[Удален] 2023.07.25 19:14 #31566

mytarmailS #:

надо просто нормально на "высоком уровне" обяснить сначала для чего это все , потом просто по пунктам действия , а ты сразу начал с часностей по "низкому уровню" , с терминов , без всякой структыры..

Никто толком ничего не понял и понять не мог в принцепе..

Это как выйти на сцену и 10 раз сказать абра-кадабра , а потом сказать - кто не понял читайте книжку

естестевенно никто ничего не понял, естестевенно никто ничего читать не будет..

в R тут по казуалу пакетов штук 100 , я хз вообще куда смотреть.. какай это должен быть кластер алгоритмов?

Сразу написал, что буду обсуждать материал, поскольку он мне интересен. И написал свои мысли по теме. Очковтирательством заниматься вообще нет желания.

mytarmailS 2023.07.25 19:23 #31567

Maxim Dmitrievsky #:
Сразу написал, что буду обсуждать материал, поскольку он мне интересен. И написал свои мысли по теме. Очковтирательством заниматься вообще нет желания.

я бы это назвал умением формулировать мысли, и быть последовательным

[Удален] 2023.07.25 19:25 #31568

mytarmailS #:

я бы это назвал умением формулировать мысли, и быть последовательным

Я крайне последователен. Чтобы увидеть слона, нужно прочесть. А спрашивать что куда подставить бессмысленно.

И в книге все написано последовательно. Начиная с того, почему корреляция не является каузацией. И в чем разница. И как быть и что делать.

Почему прогнозирующие модели ассоциативны, как бы вы их не обучали и какие признаки не перебирались бы.

MMA_Breakout_strategy_volume I (без MM Новая версия платформы MetaTrader Помогите - оценка влияния

mytarmailS 2023.07.25 19:29 #31569

Maxim Dmitrievsky #:
Я крайне последователен. Чтобы увидеть слона, нужно прочесть. А спрашивать что куда подставить бессмысленно.

как раз таки ссмысленно!

в книжке всерано не написано как ты это к рынку применил, а тут по нескольким пунктам можно разобрать и за 20 минут уже тестировать, а не читать неделю непонятно что с непонятным результатом

Чудеса с тестером. К вопросу о мультивалютности Советники: DVD Level

[Удален] 2023.07.25 19:34 #31570

Обсуждение - это когда ты прочел и хочешь теперь обсудить. Я же не прошу вас объяснять мне вашу муть, которой занимаетесь.

Если ты хочешь только изрыгнуть свое негодование, как Саныч, то это зря потраченные старания :) как будто для него это какой-то раздражитель, не вписывающийся в его картину мира. И так извергнул из себя и сяк, и все мимо :)

Филосовский вопрос - что А почему "все" тратят Разница M1 и M15

Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 3157