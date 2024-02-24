Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 3371
Você está entendendo mal o fogão. Parece que você nunca olhou para o código de construção de árvore.... Não há operações em uma única linha!!!, somente com conjuntos (completos ou em lotes).Em resumo:
Um conjunto aleatório/completo de linhas passado para o treinamento é classificado um a um para cada preditor/coluna. Diferentes divisões são verificadas (média/percentual/aleatória), as estatísticas de cada uma são contadas e a melhor divisão é selecionada para todo o conjunto de linhas, e não para uma ou cada linha, como você sugeriu.
De acordo com a melhor divisão, o conjunto de cadeias de caracteres é dividido em dois conjuntos e, em seguida, cada conjunto é classificado novamente e a melhor divisão é selecionada para cada uma das partes etc. até que a regra de parada seja atingida (por profundidade, número de exemplos por linha etc.)
Você pode ver mais detalhes no editor, pois tem o arquivo:
\MQL5\Include\Math\Alglib\dataanalysis.mqh
Função ClassifierSplit() e a função a partir da qual ela é chamada.
Você entenderá isso em algumas horas e não precisará falar sobre a pesquisa de preditores em uma linha.
1. Classe RegressionTree()
Você está certo sobre muitas linhas.
Vamos voltar ao início: o que é um padrão em uma floresta aleatória?
É uma única árvore. Aqui está um exemplo de uma dessas árvores da RF:
Total de linhas = 166+185! Todas elas não se encaixaram
Há 150 árvores desse tipo em meu modelo
Considere novamente o caminho que forma a folha. Em meu exemplo acima, há 5 divisões. Isso não é uma descrição do padrão de 2 vértices com uma depressão? Descrição.
7 divisões podem descrever a cabeça, os ombros etc.
Cada folha de uma árvore descreve um padrão diferente.
A floresta é a opinião da multidão (derviews).
A 1ª árvore diz: essa string se encaixa no meu 18º padrão/folha e a resposta = 1
2ª: a mesma string se encaixa no meu 215 padrão/folha e dá a resposta=0
3ª: = 1
...
Fazemos a média e obtemos a opinião média de 150 árvores. Por exemplo, = 0,78. Cada uma tinha uma folha/padrão ativado diferente.
Não sabemos quantas folhas.
O número de árvores é um parâmetro que pode ser alterado para obter o tamanho mínimo da amostra para treinamento.
Vemos que 50 árvores são suficientes, portanto, é conveniente considerar uma árvore como um padrão.
A árvore responde a cada situação/linha com uma folha/padrão. Em outras situações, a resposta será dada por outras folhas/padrões.
Parece que não apenas a folha, mas também a árvore não resolve nada.
Aqui encontrei a fórmula para o classificador final
Onde
Também vale a pena observar que, na tarefa de classificação, escolhemos a solução por votação majoritária, enquanto na tarefa de regressão escolhemos a solução pela média.
Por que ele não resolve? Ela contribui com (1/150) para a resposta final.
De cada árvore, uma das folhas/padrões ativados participa da votação (média).
A resposta da floresta é a média das respostas de todas as árvores (ou folhas/padrões ativados) - essa fórmula a contabiliza. A maioria para classificação binária será se a média for >0,5, então 1, caso contrário, 0.
Mas a borda 0,5 provavelmente não é a melhor opção; se o pacote der acesso ao valor da média, você poderá experimentar diferentes bordas.
A árvore responde a cada situação/linha com uma folha/padrão. Em outras situações, a resposta será dada por outras folhas/padrões.
Parece que não apenas a folha, mas também a árvore não resolve nada.
Não apenas uma folha, mas todas as árvores são responsáveis por cada situação, mas nem todas estão ativadas; a soma das previsões das que estão ativadas é a previsão do modelo....
De que diabos vocês estão falando, especialistas em modelos de árvores?
Não uma folha, mas todas as árvores são responsáveis por cada situação, mas nem todas são ativadas; a soma das previsões das que são ativadas é a previsão do modelo.
De que diabos vocês estão falando, especialistas em modelos de árvores?