Обсуждение статьи "Возможности Мастера MQL5, которые вам нужно знать (Часть 3): Энтропия Шеннона"

 

Опубликована статья Возможности Мастера MQL5, которые вам нужно знать (Часть 3): Энтропия Шеннона:

Современный трейдер почти всегда находится в поиске новых идей. Он постоянно пробует новые стратегии, модифицирует их и отбрасывает те, что не оправдали себя. В этой серии статей я постараюсь доказать, что Мастер MQL5 является настоящей опорой трейдера.

В 1948 году Клод Шеннон представил свою статью "Математическая теория связи", в которой была выдвинута идея об информационной энтропии. Энтропия — понятие, пришедшее из физики. Это мера степени активности частиц внутри объекта. Например, если мы рассмотрим три состояния воды - лед, жидкость и газ, мы увидим, что кинетическая энергия частицы наибольшая в газообразном состоянии и наименьшая в виде льда. Понятие применяется в математике применительно к вероятности. Рассмотрим следующие три набора.

Набор 1:

Набор 1


Набор 2: 

Набор 2


Набор 3: 

Набор 3


Какой из этих наборов имеет наибольшую энтропию? 
Если вы выбрали последний вариант, то вы правы, но как мы можем подтвердить правильность этого ответа? Самый простой способ ответить на этот вопрос — взять количество способов реорганизации каждого набора в качестве оценки энтропии, игнорируя при этом совпадения по цвету. Таким образом, для первого набора существует только один способ "реорганизовать" его. Однако если мы после этого посмотрим на наборы, то увидим, что количество перестановок относительно цвета значительно увеличивается, поэтому мы можем утверждать, что последний набор имеет самую высокую энтропию. 

Автор: Stephen Njuki

 

Прочитал статью, но толком не понял:

1. Что подаёте на вход случайному лесу.

2. Как считаете энтропию - по истории классификации леса?

Перевод статьи не высокого качества, к сожалению, что осложняет понимание.

Иногда кажется, что не хватает иллюстраций к статье, хотя в тексте идёт о них речь:

"

Давайте рассмотрим наглядный пример — на картинке выше традиционное дерево решений (обозначено синим цветом) может выбирать из всех четырех атрибутов при принятии решения о том, как разделить узел. Оно решает использовать Атрибут 1 (черный и подчеркнутый), поскольку при этом данные разбиваются на максимально разделенные группы.

"

Причина обращения: