Обсуждение статьи "Измерение информативности индикатора"

Ivbmw 2023.04.03 13:42 #1

MetaQuotes:

Опубликована статья Измерение информативности индикатора:

Ну и зачем столько букав? Так автор определил хоть какой-нибудь стоящий индикатор? В смысле, сам что-то нашел для бабла? Суть то ведь проста - есть инструмент для бабла с высокой вероятностью прибыли? Или всё одинаково, около рулетки, либо будет либо нет.

Миллионы юзеров, миллионы стратежек, годы и годы существования торгов, а рынок еще не обвалился от нового клондайкера. Как не приводили достойных вариантов, так и не приводят, типа сами-сами ковыряйте. Так наковырял автор грааль или это академическая наука и за рост депо автор не ручается? Хех

Индикаторы: Directed Movement Alert Платные советники [АРХИВ] Любой вопрос новичка,

BillionerClub 2023.04.03 17:28 #2

Статья супер! такого жанра как раз не хватает на MQl5. Спс

Aleksey Vyazmikin 2023.04.04 04:43 #3

Спасибо за поднятую тему.

Прошу прокомментировать несколько противоречивую информацию, цитирую две части статьи:

"

Чтобы применить уравнение энтропии к непрерывным переменным, мы должны дискретизировать значения индикатора. Это делается путем деления диапазона значений на интервалы одинакового размера, а затем подсчета количества значений, попадающих в каждый интервал. При использовании этого метода исходное множество, перечисляющее максимальный диапазон всех значений индикатора, заменяется подмножествами, каждое из которых представляет собой выбранные интервалы.

...

Intervals - количество интервалов для дискретизации. Автор TTMTS указывает 20 интервалов для размера выборки в несколько тысяч, причем 2 являются жестким минимальным значением. Я добавил свой собственный подход к подходящему значению, реализовав возможность варьировать количество интервалов относительно размера выборки, в частности, 51 на каждые 1000 выборок. Эта опция доступна, если пользователь вводит любое значение меньше 2. Таким образом при установке Interval на любое число меньше 2 количество используемых интервалов будет меняться в зависимости от количества анализируемых баров.

"

Вопрос, это об одном и том же идет речь? Если да, то почему число разделителей диапазона значений индикатора ставиться в зависимость от числа баров? В чем тут логика? Пока могу предположить, что это полезно только для индикаторов, имеющих какую либо накопительную составляющую.

Если нет, то чему равно число делителей диапазона?

В статье не хватает таблицы, в которой бы явно показывался толк от преобразований значений индикаторов.

торговая стратегия на базе Машинное обучение в трейдинге: Учебники по программированию

Anil Varma 2025.03.26 14:33 #4

MetaQuotes:

Опубликована новая статья Измерение индикаторной информации:

Автор: Фрэнсис Дюбе

Здравствуйте, Фрэнсис.

Не могли бы вы рассказать, как протестировать пользовательский индикатор для EntrophyAnalysis.

Я пытаюсь использовать следующий вариант:

input ENUM_TIMEFRAMES Таймфрейм=PERIOD_H1;

input ENUM_INDICATOR IndicatorType=IND_CUSTOM;

input string CustomIndicatorName="Indicators\\\NKGold\\\Regression\\\iNonLinRegress.ex5";

input bool UseDefaults=true;

input string IndicatorParameterTypes="int,CENUM_APPLIED_PRICE";

input string IndicatorParameterValues="34,priceHA_WEIGHTED";

и получаем ошибку, как показано ниже

2025.03.26 19:53:11.282 EntropyIndicatorAnalysis (XAUUSD,H1) custom indicator 'Indicators\NKGold\Regression\iNonLinRegress.ex5' cannot load [4802]

2025.03.26 19:53:11.282 EntropyIndicatorAnalysis (XAUUSD,H1) Invalid indicator handle, error code: 4802

Обсуждение статьи "Основы тестирования Удаление экземпляров индикаторов: IndicatorRelease Простой способ создания экземпляров

niouininon 2025.07.18 09:02 #5

Ivbmw #:
Почему так много букв? Выявил ли автор достоверный индикатор? Другими словами, нашел ли он что-то для заработка? Вопрос прост: существует ли инструмент для заработка с высокой вероятностью прибыли? Или это все одно и то же, как рулетка: либо работает, либо нет.

Миллионы пользователей, миллионы стратегов, годы и годы торговли, а рынок все еще не рухнул из-за нового Клондайкера. Поскольку они не привели ни одного действенного варианта, они также, как и они сами, не привели ни одного самовыбора. Нашел ли автор Святой Грааль или это академическая наука, и автор не ручается за рост депо? Хех

Статья не претендует на открытие Святого Грааля, который точно напечатает банкноты. Ее цель более скромна: показать , как измерить богатство информации, которую показатель привносит в модель обучения.

Высокий показатель энтропии означает лишь то, что переменная нетривиальна (она изменяется в достаточной степени, чтобы алгоритм мог обучаться). Он не гарантирует направления, времени или выигрышного управления деньгами.
Даже высокоинформативный индикатор может оказаться непредсказуемым, если рынок уже эффективен на выбранном горизонте, если транзакционные издержки поглощают сигнал или если модель плохо разработана.
На практике приходится складывать несколько составных частей: отбор индикаторов с хорошей энтропией, строгие тесты вне выборки, управление рисками, надежное исполнение и мониторинг в реальном времени. Только объединив все эти шаги, мы надеемся добиться небольшого преимущества, и это должно постоянно перепроверяться по мере адаптации рынка.
Автор предлагает академический диагностический инструмент. Он не гарантирует успеха. Каждый волен использовать его для уточнения своих характеристик или, наоборот, понять, что любимый индикатор не дает ничего нового.

Короче говоря, энтропия - это термометр, а не эликсир. Она помогает быстро обнаружить мертвые или недостаточно используемые переменные. Она не заменяет стратегию или контроль над рисками.

Машинное обучение в трейдинге: Как начать работу с Разговор с искусственным интеллектом

niouininon 2025.07.18 09:21 #6

Aleksey Vyazmikin диапазон значений на интервалы одинакового размера, а затем подсчитываем количество значений в каждом интервале. При использовании этого метода исходный набор, содержащий максимальный диапазон всех значений индикатора, заменяется подмножествами, представляющими каждый из выбранных интервалов.
...

Интервалы - количество интервалов для выборки. Автор TTMTS указывает 20 интервалов для выборки в несколько тысяч человек, причем 2 являются абсолютным минимумом. Я добавил свой собственный подход к определению подходящего значения, реализовав возможность варьировать количество интервалов в зависимости от размера выборки, в частности 51 для 1000 образцов. Эта возможность доступна, если пользователь вводит значение меньше 2. Таким образом, если задать значение Interval меньше 2, количество используемых интервалов будет варьироваться в зависимости от количества анализируемых баров.

"

Вопрос: это одно и то же? Если да, то почему количество разделителей в диапазоне значений индикатора зависит от количества баров? В чем логика этого? Пока могу только предположить, что это полезно для индикаторов, имеющих накопительную составляющую.

Если это не так, то чему соответствует количество делителей в диапазоне?

В статье отсутствует таблица, которая бы наглядно показала пользу от преобразования значений индикаторов.

Чтобы оценить энтропию непрерывной переменной, мы делим диапазон ее значений на равные интервалы и подсчитываем количество наблюдений в каждом интервале. Скрипт позволяет выбрать количествоинтервалов. Если вы введете значение < 2 (или оставите значение по умолчанию), скрипт запустит собственную эвристику: 51 интервал на 1000 наблюдений, то есть число, пропорциональное размеру выборки. Если вы вводите значение > 2, он использует его как есть, так что это не два конкурирующих метода. Один описывает концепцию, другой объясняет , как код выбирает параметр, если вы не задали его сами.

Когда у вас слишком мало интервалов, вы искусственно склеиваете значения вместе. Энтропия недооценивается (смещение). Когда для маленькой выборки слишком много интервалов, в ней много пустых бинов или бинов с одним наблюдением. Энтропия сильно зашумлена (дисперсия). Для гистограмм существует несколько автоматических правил: Стерджеса, квадратного корня, Фридмана-Диакониса, Скотта и т. д.). Все они имеют одну и ту же идею: увеличивайте разрешение, когда у вас больше данных, потому что тогда вы сможете оценить более тонкие вероятности, не увеличивая дисперсию.

Для 1 000 баров 51 интервал => 20 точек на бин, если распределение было равномерным. Это соотношение (между 15 и 30 наблюдений / класс) является классическим компромиссом, который автор взял из литературы. Это не имеет никакого отношения к тому, является ли индикатор накопительным или нет. Логика чисто статистическая. Тонкость построения сетки зависит от количества доступной информации.

Чем больше вертикальных полос в гистограмме:

тем заметнее тонкость распределения показателя,
тем больше деталей (пиков и впадин) может уловить расчет энтропии,
но тем больше данных необходимо для того, чтобы эти частоты были стабильными.

Правда, в статье было бы полезно показать, например, энтропию одного и того же индикатора до и после преобразований, но это легко сделать самостоятельно. Просто поставьте в скрипте галочку ApplyTransform=true и прочитайте двойной вывод: до/после. В коде намеренно оставлена интерактивная часть, чтобы каждый мог протестировать свои активы и горизонты.

Машинное обучение и нейронные Машинное обучение в трейдинге: Обсуждение статьи "Роль статистических

Aleksey Vyazmikin 2025.07.18 09:48 #7

niouininon #:
Чем больше вертикальных полос в гистограмме:

тем заметнее тонкость распределения показателя,
тем больше деталей (пиков и впадин) может уловить расчет энтропии,
но тем больше данных необходимо для того, чтобы эти частоты были стабильными.

Как я понял, визуализация показателей индикаторов в выборке через гистограмму никак не связана с методами преобразования данных у автора. Правильно я понял?

Меня больше интересует вопрос получаемого эффекта при обучении от этих преобразований. Я могу предположить его для нейронных сетей, но для древовидных методов - нет.

Коэффициент соотношения инструментов OrdersHistoryTotal, что не так? Обсуждение статьи "Машинное обучение

niouininon 2025.07.18 13:31 #8

Aleksey Vyazmikin #:

Если я правильно понимаю, визуализация показателей в выборке с помощью гистограммы не имеет никакого отношения к авторским методам преобразования данных. Я прав?

Меня больше интересует вопрос о влиянии этих преобразований. Я могу предположить это для нейронных сетей, но не для древовидных методов.

Гистограмма, построенная скриптом, - это просто инструмент визуальной диагностики. Она показывает, как распределены значения показателя в выборке до или после преобразования. Функции sqrt, log, tanh и т. д. воздействуют на данные. Гистограмма просто отображает результат. Таким образом, два этапа являются независимыми. Сначала ряд преобразуется (или нет), затем строится его гистограмма, чтобы увидеть, изменилась ли энтропия.

Преобразование показателя, который стал достаточно монотонным (log, sqrt), часто не меняет результат. С другой стороны, немонотонные преобразования (tanh, saturates) меняют порядок определенных точек. Это означает, что определенные преобразования лучше подготавливают почву для создания нелинейных взаимодействий.

Как отличить график FOREX Вопрос по теореме Такенса Преобразование абсолютных показателей осциллятора

Aleksey Vyazmikin 2025.07.18 14:11 #9

niouininon #:

Гистограмма, построенная скриптом, - это просто инструмент визуальной диагностики. Она показывает, как распределены значения показателя в выборке до или после преобразования. Функции sqrt, log, tanh и т. д. воздействуют на данные. Гистограмма просто отображает результат. Таким образом, два этапа являются независимыми. Сначала ряд преобразуется (или нет), затем строится его гистограмма, чтобы увидеть, изменилась ли энтропия.

Хорошо, значит я правильно понял сейчас суть. Изначально подумал о другом.

niouininon #:

Преобразование показателя, который стал достаточно монотонным (log, sqrt), часто не меняет результат. С другой стороны, немонотонные преобразования (tanh, saturates) меняют порядок определенных точек. Это означает, что определенные преобразования лучше подготавливают почву для создания нелинейных взаимодействий.

Каким это образом меняется порядок точек? Можете привести пример такого преобразования. Пока понял изречение так, что были точки ABC с собственными значениями по возрастанию, а после преобразования порядок по возрастанию стал, как вариант, BAC.

Автоматический расчет описательных статистик Нужна помощь профессионального программиста Ищем прок от применения

niouininon 2025.07.18 21:12 #10

Aleksey Vyazmikin #:

Хорошо, теперь я понял идею. Изначально я думал о чем-то другом.

Как меняется порядок точек? Можете ли вы привести пример такого преобразования? Пока я понял, что есть точки ABC с собственными значениями в порядке возрастания, и что после преобразования порядок возрастания стал, поочередно, BAC.

Функции в скрипте (root, log, tanh и т.д.) все монотонно возрастающие. Все они сохраняют порядок точек. Мое предыдущее предложение было двусмысленным. Порядок меняется с ABC на BAC только в том случае, если используется немонотонное преобразование. Например, если я не ошибаюсь, функция f(x)=∣x-50∣ не является монотонной, потому что она сворачивает ось вокруг x=50. Поэтому порядок становится BAC. Во введении автор статьи указывает нам на книгу"Testing and Tuning Market Trading Systems (TTMTS) by Timothy Masters". Что касается меня, то я планирую взять ее в руки, потому что, как и у вас, у меня осталось несколько вопросов. Более того, я не очень хорошо знаком с моделями обучения и нейронными сетями. Судя по всему, ее довольно легко найти на сайтах онлайн-продаж. Ее содержание должно нам очень помочь, потому что статья, какой бы интересной она ни была, несомненно, неполная и/или в любом случае довольно синтетическая.

Мультитаймфреймовые индикаторы Сохраняется ли ограничение в Как получить информацию об