Discussão do artigo "Funcionalidades do assistente MQL5 que você precisa conhecer (Parte 03): Entropia de Shannon"

 

Novo artigo Funcionalidades do assistente MQL5 que você precisa conhecer (Parte 03): Entropia de Shannon foi publicado:

O trader de hoje é um filomata que está quase sempre procurando novas ideias, experimentando-as, escolhendo modificá-las ou descartá-las; um processo exploratório que deve custar uma quantidade razoável de diligência. Esta série de artigos proporá que o assistente MQL5 deve ser um esteio para os traders.

Claude Shannon em 1948 apresentou o seu artigo “A mathematical theory of communication” que tinha o novo ideal da entropia de informação. A entropia é um conceito da física. É uma medida da extensão em que as partículas dentro de um objeto estão ativas. Se considerarmos os 3 estados da água, ou seja, gelo, líquido e vapor, por exemplo; podemos ver que a energia cinética da partícula é maior no vapor e menor no gelo. Esse mesmo conceito é aplicado na matemática via probabilidade. Considere os três conjuntos a seguir.

Conjunto 1: 

Conjunto 1


Conjunto 2: 

Conjunto 2


Conjunto 3: 

Conjunto 3


Se você adivinhasse qual desses conjuntos teria a maior entropia?
Se você escolheu o último, acertou, mas como validamos essa resposta? A maneira mais simples de responder a isso pode ser considerando o número de maneiras pelas quais você pode reorganizar cada conjunto como a estimativa de entropia, ignorando os trechos de cores semelhantes. Para o primeiro conjunto, há apenas uma maneira de 'reorganizá-lo', no entanto, quando olhamos para os conjuntos depois, claramente, o número de permutações em relação à cor aumenta significativamente, portanto, você pode argumentar que o último conjunto tem a maior entropia 

Autor: Stephen Njuki

 

Li o artigo, mas não o entendi muito bem:

1. O que você alimenta a floresta aleatória como entrada.

2. Como você calcula a entropia - com base no histórico de classificação da floresta?

Infelizmente, a tradução do artigo não é de alta qualidade, o que dificulta a compreensão.

Às vezes, parece que não há ilustrações suficientes para o artigo, embora o texto fale sobre elas:

"

Vejamos um exemplo ilustrativo - na figura acima, uma árvore de decisão tradicional (indicada em azul) pode escolher entre todos os quatro atributos ao decidir como dividir um nó. Ela decide usar o Atributo 1 (preto e sublinhado), pois ele divide os dados em grupos separados ao máximo.

"

 

Há problemas com esse gerador de sinais. O código em si não faz sentido.

Comecei a perceber os problemas quando a linha 158 estava incorreta. Você está criando um número de regras __INPUTS quando deveria ser

__RULES.


Entendo que a floresta de decisões é usada durante a otimização, mas qual é o sentido quando você não está

Parece que a floresta de decisão é usada para verificar algo, mas não contribui em nada para a decisão do sinal.

E, se você estiver usando a floresta de decisão, o uso não é explicado (ou requer conhecimento prévio). Aqui:


CDForest::DFProcess(DF,m_in_calculations,m_out_calculations);

   m_update.B(m_out_calculations[1]);


Você está mudando o perfil do conjunto neutro. Isso afeta o sinal, mas você poderia explicar como e por quê, por favor.

Todo o resto está excelente.