Discussão do artigo "Florestas Aleatórias na Previsão das Tendências" - página 9

 
Reshetov:
Agora você arruinou tudo. E como é possível que sua alta IA não tenha reconhecido imediatamente uma soma trivial?
 
gpwr:

faa1947, mostre como seu modelo funciona no exemplo abaixo. A primeira coluna é a série modelada, a segunda e a terceira colunas são os preditores. Qual é o poder de previsão desses preditores?

-0.35742 0.461646 -0.81907
0.431277 0.004545 0.426731
-0.00018 -0.4037 0.403528
-0.08575 0.90851 -0.99426
0.773826 0.008975 0.764852
0.426905 -0.96485 1.391757
0.253233 0.487955 -0.23472
0.20994 0.880554 -0.67061
-0.09929 0.160276 -0.25956
0.332911 -0.08736 0.420268
0.032258 0.360106 -0.32785
0.253027 -0.06859 0.321621
-0.66668 -0.54985 -0.11683
-0.5476 -0.13231 -0.41529
-0.75652 0.536488 -1.29301
-0.66109 -0.87314 0.212052
-0.09993 -0.86293 0.763
0.014625 0.715032 -0.70041
-0.48345 -0.62666 0.143206
-0.03596 0.935653 -0.97161
-0.17023 0.678024 -0.84826
0.293376 0.079529 0.213847
0.002922 0.754594 -0.75167
0.329194 -0.05535 0.384546
0.639423 -0.41358 1.053007
0.431631 -0.60334 1.034973
0.59125 0.497989 0.093262
0.266098 -0.79645 1.062549
-0.02624 0.643164 -0.6694
0.055014 -0.46214 0.517154
0.436132 -0.89992 1.336052
-0.30143 0.628619 -0.93005
-0.12168 0.886467 -1.00814
-0.10851 -0.0507 -0.0578
-0.74573 -0.50921 -0.23653
-0.574 0.244825 -0.81883
-0.87313 0.336188 -1.20932
-0.00344 0.117363 -0.1208
-0.20265 0.424326 -0.62697
0.177873 -0.17967 0.357541

Não sou um matemático generalista. Tento raciocinar de forma muito concreta e, com base na negociação, não é difícil obter uma amostra de 10.000 linhas. Não sei como tirar conclusões com base em 40 linhas e não vejo a necessidade de aprender, embora tudo o que eu fale seja aplicável a essas amostras. Para a medicina, 40 linhas é normal.

1. Em geral, estou escrevendo sobre o treinamento excessivo do modelo no qual surgiu a "capacidade preditiva".

2. Estou preocupado com a previsão de valores nominais - "long-short". Esses são modelos de classificação. Seu exemplo, modelos de regressão, eu não faço.

Estou disposto a continuar.

Preciso de uma cotação na qual eu possa executar um ZZ e ter vários rompimentos. Por isso, preciso de um arquivo bastante grande.

Além da própria cotação, vários preditores, até mesmo um. Responderei à pergunta: esse preditor tem poder preditivo de posições compradas e vendidas.

E é claro que é necessário um arquivo - ou você sugere digitar tudo à mão?

 

TheXpert:

Reshetov:

O segredo da "alta generalização" de sua amostra é revelado: o valor da primeira coluna é a soma dos valores das outras duas colunas.


Agora você estragou tudo). E como é possível que sua alta IA não tenha reconhecido uma soma trivial de imediato?

E ela não foi projetada para reconhecer somas, pois constrói modelos para classificação binária, e a tarefa é da seção de regressão múltipla.

Embora o modelo seja para classificação binária, ainda assim, a expressão:

double x0 = 2.0 * (v0 + 0.96485) / 1.900503 - 1.0;

double x1 = 2.0 * (v1 + 1.00814) / 2.399897 - 1.0;

y = 0.12981203254657206 + 0.8176828303879957 * x0 + 1.0 * x1 -0.005143248786272694 * x0 * x1;

é simplificada para: y ~ v0 + v1.

E então tudo o que resta é testar a hipótese em uma planilha.

 

Boa tarde, SanSanych.

Sobre a questão do subtreinamento e do supertreinamento, você pode consultar o rascunho do livro aqui http://www.iro.umontreal.ca/~bengioy/dlbook/.

A seção 5.3.3 descreve tudo muito bem. Em geral, o livro inteiro é muito útil, especialmente se for escrito por coryphets.

Boa sorte

 
vlad1949:

Boa tarde, SanSanych.

Sobre a questão do subtreinamento e do supertreinamento, você pode consultar o rascunho do livro aqui http://www.iro.umontreal.ca/~bengioy/dlbook/.

A seção 5.3.3 descreve tudo muito bem. Em geral, o livro inteiro é muito útil, especialmente se for escrito por coryphets.

Boa sorte

Boa tarde!

Obrigado pelo link.

Tenho um conjunto completo de ferramentas e uma seleção de literatura sobre o assunto. Mas isso não facilita a aplicação prática.

Se desejar, posso compartilhar na esperança de reunir todo esse conjunto de ferramentas para a automaticidade.

 
faa1947:

Boa tarde!

Obrigado pelo link.

Tenho um conjunto completo de ferramentas e uma seleção de literatura sobre o assunto. Mas isso não facilita a aplicação prática.

Se desejar, posso compartilhar a esperança de reunir todo esse conjunto de ferramentas para automatismo.

Resolvo esse problema de forma programática. Os resultados são ótimos.

Boa sorte

 
faa1947:

Não sou um especialista em matemática universal. Tento raciocinar de forma muito concreta e, com base na negociação, não é difícil obter uma amostra de 10.000 linhas. Não sei como tirar conclusões com base em 40 linhas e não vejo a necessidade de aprender, embora tudo o que eu fale seja aplicável a essas amostras. Para a medicina, 40 linhas são normais.

1. Em geral, estou escrevendo sobre o treinamento excessivo do modelo no qual surgiu a "capacidade preditiva".

2. Estou preocupado com a previsão de valores nominais - "long-short". Esses são modelos de classificação. Seu exemplo, modelos de regressão, eu não faço.

Estou disposto a continuar.

Preciso de uma cotação na qual eu possa executar um ZZ e ter vários rompimentos. A partir daí, preciso de um arquivo bastante grande.

Além da própria cotação, vários preditores, até mesmo um. Responderei à pergunta: esse preditor tem poder preditivo de posições compradas e vendidas.

E, é claro, é necessário um arquivo - ou você sugere digitar tudo à mão?

Entendo. É muito fácil verificar se o modelo está com excesso de treinamento comparando seu comportamento na amostra de treinamento e fora dela. Mas a maneira de fazer com que o modelo não seja treinado em excesso depende de nossa capacidade de determinar quais entradas de previsão são relevantes para a série modelada e quais não são, o que é muito mais difícil do que determinar o treinamento em excesso. A capacidade de generalização de um modelo depende de seu sobreajuste. O exemplo que dei é muito simples. A série y que está sendo modelada é uma onda senoidal com ruído. O primeiro preditor x1 são números aleatórios. O segundo preditor x2 é a diferença x2 = y-x1. Em outras palavras, o modelo é descrito com precisão pela soma dos preditores y = x1+x2. O fato de você ter se recusado a aplicar seu método a esse exemplo simples apenas levanta a suspeita de que seu método não é capaz de determinar a relevância dos dados, e determinar essa relevância é precisamente o principal objetivo de identificar o treinamento excessivo e eliminá-lo. Os problemas reais de modelagem são muito mais complexos do que o meu exemplo - eles incluem tanto dados relevantes quanto dados muito mais irrelevantes. Separar um do outro é incrivelmente difícil. Uma rede neural com todas as entradas será treinada para ter conexões com as entradas relevantes e não relevantes e, portanto, será retreinada. Como você aparentemente não sabe como determinar a relevância dos dados, não tenho interesse em seus artigos e livros. Boa sorte!
 
gpwr:

É muito fácil verificar se o modelo está treinado em excesso comparando seu comportamento na amostra de treinamento e fora dela.

Essa é uma grande ilusão e, pelo que sei, ainda não foi paga por você. O modelo apresentado no artigo tem resultados igualmente bons em três amostras fora do treinamento, mas esse modelo está treinado em excesso.

E como fazer com que o modelo não seja treinado em excesso depende de nossa capacidade de determinar quais entradas de previsão são relevantes para a série modelada e quais não são, o que é muito mais difícil do que determinar o treinamento em excesso.

Primeiro, leia o artigo com atenção - a Tabela 3 apresenta a importância dos preditores na previsão da variável-alvo

Em seguida, aprenda a matriz, por exemplo, estude pacotes especializados para selecionar preditores varSerf, Boruta, FSelector. E o pacote CORElearn tem 35 (!) algoritmos diferentes para selecionar preditores importantes para a variável de destino.

Com base em minha experiência na seleção de preditores importantes para a variável de destino.

1. Formamos um conjunto bastante grande de preditores, por exemplo, 50 peças com o número de barras 15000.

2. Com a ajuda de um dos algoritmos mencionados acima, selecionamos os preditores nessas 15 mil barras - geralmente obtemos de 15 a 20 partes, que são usadas na criação de modelos com mais frequência do que em 20% dos casos.

3. Em seguida, pegamos uma janela menor, por exemplo, 2.000 barras e começamos a movê-la uma barra de cada vez, selecionando preditores significativos entre os 20 de 50 selecionados anteriormente.

4. A lista específica de preditores significativos muda o tempo todo.

Como você aparentemente não sabe como determinar a relevância dos dados, não tenho interesse em seus artigos e livros.

A eficiência do uso desses pacotes em suas mãos aumentará muito se você gastar uma pequena quantia de dinheiro em meu livro, que explica por que ele é necessário e como entendê-lo, além de exemplos reais sobre dados reais.

E o efeito será ainda maior se você e eu tentarmos juntos criar um modelo não treinado em seus preditores. O sucesso não é garantido, mas é garantido que você não escreverá postagens tão superficiais depois de se comunicar comigo. Além disso, você será muito mais cuidadoso em contas reais.

 
faa1947:

1. formamos um conjunto bastante grande de preditores, por exemplo, 50 peças com o número de barras 15000.

Bem, agora está claro por que você ganha dinheiro vendendo seu livro e não negociando.

 
faa1947:

Essas são grandes ilusões e, pelo que sei, ainda não foram pagas por você. O modelo fornecido no artigo tem resultados igualmente bons em três amostras fora do treinamento, mas esse modelo está treinado em excesso.

Excesso de treinamento é um termo bem estabelecido e bastante específico. Você não está apenas substituindo-o, mas também não está explicando o que ele significa em seu entendimento.

A maneira como você fala lembra muito a de Sulton.