Discussão do artigo "Florestas Aleatórias na Previsão das Tendências"

TheXpert 2014.12.18 09:58 #81

Reshetov:

Agora você arruinou tudo. E como é possível que sua alta IA não tenha reconhecido imediatamente uma soma trivial?

СанСаныч Фоменко 2014.12.18 10:08 #82

gpwr:

faa1947, mostre como seu modelo funciona no exemplo abaixo. A primeira coluna é a série modelada, a segunda e a terceira colunas são os preditores. Qual é o poder de previsão desses preditores?

-0.35742	0.461646	-0.81907
0.431277	0.004545	0.426731
-0.00018	-0.4037	0.403528
-0.08575	0.90851	-0.99426
0.773826	0.008975	0.764852
0.426905	-0.96485	1.391757
0.253233	0.487955	-0.23472
0.20994	0.880554	-0.67061
-0.09929	0.160276	-0.25956
0.332911	-0.08736	0.420268
0.032258	0.360106	-0.32785
0.253027	-0.06859	0.321621
-0.66668	-0.54985	-0.11683
-0.5476	-0.13231	-0.41529
-0.75652	0.536488	-1.29301
-0.66109	-0.87314	0.212052
-0.09993	-0.86293	0.763
0.014625	0.715032	-0.70041
-0.48345	-0.62666	0.143206
-0.03596	0.935653	-0.97161
-0.17023	0.678024	-0.84826
0.293376	0.079529	0.213847
0.002922	0.754594	-0.75167
0.329194	-0.05535	0.384546
0.639423	-0.41358	1.053007
0.431631	-0.60334	1.034973
0.59125	0.497989	0.093262
0.266098	-0.79645	1.062549
-0.02624	0.643164	-0.6694
0.055014	-0.46214	0.517154
0.436132	-0.89992	1.336052
-0.30143	0.628619	-0.93005
-0.12168	0.886467	-1.00814
-0.10851	-0.0507	-0.0578
-0.74573	-0.50921	-0.23653
-0.574	0.244825	-0.81883
-0.87313	0.336188	-1.20932
-0.00344	0.117363	-0.1208
-0.20265	0.424326	-0.62697
0.177873	-0.17967	0.357541

Não sou um matemático generalista. Tento raciocinar de forma muito concreta e, com base na negociação, não é difícil obter uma amostra de 10.000 linhas. Não sei como tirar conclusões com base em 40 linhas e não vejo a necessidade de aprender, embora tudo o que eu fale seja aplicável a essas amostras. Para a medicina, 40 linhas é normal.

1. Em geral, estou escrevendo sobre o treinamento excessivo do modelo no qual surgiu a "capacidade preditiva".

2. Estou preocupado com a previsão de valores nominais - "long-short". Esses são modelos de classificação. Seu exemplo, modelos de regressão, eu não faço.

Estou disposto a continuar.

Preciso de uma cotação na qual eu possa executar um ZZ e ter vários rompimentos. Por isso, preciso de um arquivo bastante grande.

Além da própria cotação, vários preditores, até mesmo um. Responderei à pergunta: esse preditor tem poder preditivo de posições compradas e vendidas.

E é claro que é necessário um arquivo - ou você sugere digitar tudo à mão?

Aprendizado de máquina no Existe um padrão para Econometria: um passo à

Yury Reshetov 2014.12.18 10:25 #83

TheXpert:

Reshetov:

O segredo da "alta generalização" de sua amostra é revelado: o valor da primeira coluna é a soma dos valores das outras duas colunas.

Agora você estragou tudo). E como é possível que sua alta IA não tenha reconhecido uma soma trivial de imediato?

E ela não foi projetada para reconhecer somas, pois constrói modelos para classificação binária, e a tarefa é da seção de regressão múltipla.

Embora o modelo seja para classificação binária, ainda assim, a expressão:

double x0 = 2.0 * (v0 + 0.96485) / 1.900503 - 1.0;

double x1 = 2.0 * (v1 + 1.00814) / 2.399897 - 1.0;

y = 0.12981203254657206 + 0.8176828303879957 * x0 + 1.0 * x1 -0.005143248786272694 * x0 * x1;

é simplificada para: y ~ v0 + v1.

E então tudo o que resta é testar a hipótese em uma planilha.

Biblioteca de classes genéricas Aprendizado de máquina no Discussão do artigo "Usando

Vladimir Perervenko 2014.12.18 11:26 #84

Boa tarde, SanSanych.

Sobre a questão do subtreinamento e do supertreinamento, você pode consultar o rascunho do livro aqui http://www.iro.umontreal.ca/~bengioy/dlbook/.

A seção 5.3.3 descreve tudo muito bem. Em geral, o livro inteiro é muito útil, especialmente se for escrito por coryphets.

Boa sorte

Discussão do artigo "Tratamento Mais uma vez, sobre Aprendizado de máquina no

СанСаныч Фоменко 2014.12.18 12:01 #85

vlad1949:

Boa tarde, SanSanych.

Sobre a questão do subtreinamento e do supertreinamento, você pode consultar o rascunho do livro aqui http://www.iro.umontreal.ca/~bengioy/dlbook/.

A seção 5.3.3 descreve tudo muito bem. Em geral, o livro inteiro é muito útil, especialmente se for escrito por coryphets.

Boa sorte

Boa tarde!

Obrigado pelo link.

Tenho um conjunto completo de ferramentas e uma seleção de literatura sobre o assunto. Mas isso não facilita a aplicação prática.

Se desejar, posso compartilhar na esperança de reunir todo esse conjunto de ferramentas para a automaticidade.

Anel Quaisquer perguntas de recém-chegados Discussão do artigo "Trabalhando

Vladimir Perervenko 2014.12.18 12:06 #86

faa1947:

Boa tarde!

Obrigado pelo link.

Tenho um conjunto completo de ferramentas e uma seleção de literatura sobre o assunto. Mas isso não facilita a aplicação prática.

Se desejar, posso compartilhar a esperança de reunir todo esse conjunto de ferramentas para automatismo.

Resolvo esse problema de forma programática. Os resultados são ótimos.

Boa sorte

Vladimir 2014.12.18 15:34 #87

faa1947:

Não sou um especialista em matemática universal. Tento raciocinar de forma muito concreta e, com base na negociação, não é difícil obter uma amostra de 10.000 linhas. Não sei como tirar conclusões com base em 40 linhas e não vejo a necessidade de aprender, embora tudo o que eu fale seja aplicável a essas amostras. Para a medicina, 40 linhas são normais.

1. Em geral, estou escrevendo sobre o treinamento excessivo do modelo no qual surgiu a "capacidade preditiva".

2. Estou preocupado com a previsão de valores nominais - "long-short". Esses são modelos de classificação. Seu exemplo, modelos de regressão, eu não faço.

Estou disposto a continuar.

Preciso de uma cotação na qual eu possa executar um ZZ e ter vários rompimentos. A partir daí, preciso de um arquivo bastante grande.

Além da própria cotação, vários preditores, até mesmo um. Responderei à pergunta: esse preditor tem poder preditivo de posições compradas e vendidas.

E, é claro, é necessário um arquivo - ou você sugere digitar tudo à mão?

Entendo. É muito fácil verificar se o modelo está com excesso de treinamento comparando seu comportamento na amostra de treinamento e fora dela. Mas a maneira de fazer com que o modelo não seja treinado em excesso depende de nossa capacidade de determinar quais entradas de previsão são relevantes para a série modelada e quais não são, o que é muito mais difícil do que determinar o treinamento em excesso. A capacidade de generalização de um modelo depende de seu sobreajuste. O exemplo que dei é muito simples. A série y que está sendo modelada é uma onda senoidal com ruído. O primeiro preditor x1 são números aleatórios. O segundo preditor x2 é a diferença x2 = y-x1. Em outras palavras, o modelo é descrito com precisão pela soma dos preditores y = x1+x2. O fato de você ter se recusado a aplicar seu método a esse exemplo simples apenas levanta a suspeita de que seu método não é capaz de determinar a relevância dos dados, e determinar essa relevância é precisamente o principal objetivo de identificar o treinamento excessivo e eliminá-lo. Os problemas reais de modelagem são muito mais complexos do que o meu exemplo - eles incluem tanto dados relevantes quanto dados muito mais irrelevantes. Separar um do outro é incrivelmente difícil. Uma rede neural com todas as entradas será treinada para ter conexões com as entradas relevantes e não relevantes e, portanto, será retreinada. Como você aparentemente não sabe como determinar a relevância dos dados, não tenho interesse em seus artigos e livros. Boa sorte!

Discussão do artigo "Algoritmo Aprendizado de máquina no Regressão Bayesiana - Alguém

СанСаныч Фоменко 2014.12.18 18:47 #88

gpwr:

É muito fácil verificar se o modelo está treinado em excesso comparando seu comportamento na amostra de treinamento e fora dela.

Essa é uma grande ilusão e, pelo que sei, ainda não foi paga por você. O modelo apresentado no artigo tem resultados igualmente bons em três amostras fora do treinamento, mas esse modelo está treinado em excesso.

E como fazer com que o modelo não seja treinado em excesso depende de nossa capacidade de determinar quais entradas de previsão são relevantes para a série modelada e quais não são, o que é muito mais difícil do que determinar o treinamento em excesso.

Primeiro, leia o artigo com atenção - a Tabela 3 apresenta a importância dos preditores na previsão da variável-alvo

Em seguida, aprenda a matriz, por exemplo, estude pacotes especializados para selecionar preditores varSerf, Boruta, FSelector. E o pacote CORElearn tem 35 (!) algoritmos diferentes para selecionar preditores importantes para a variável de destino.

Com base em minha experiência na seleção de preditores importantes para a variável de destino.

1. Formamos um conjunto bastante grande de preditores, por exemplo, 50 peças com o número de barras 15000.

2. Com a ajuda de um dos algoritmos mencionados acima, selecionamos os preditores nessas 15 mil barras - geralmente obtemos de 15 a 20 partes, que são usadas na criação de modelos com mais frequência do que em 20% dos casos.

3. Em seguida, pegamos uma janela menor, por exemplo, 2.000 barras e começamos a movê-la uma barra de cada vez, selecionando preditores significativos entre os 20 de 50 selecionados anteriormente.

4. A lista específica de preditores significativos muda o tempo todo.

Como você aparentemente não sabe como determinar a relevância dos dados, não tenho interesse em seus artigos e livros.

A eficiência do uso desses pacotes em suas mãos aumentará muito se você gastar uma pequena quantia de dinheiro em meu livro, que explica por que ele é necessário e como entendê-lo, além de exemplos reais sobre dados reais.

E o efeito será ainda maior se você e eu tentarmos juntos criar um modelo não treinado em seus preditores. O sucesso não é garantido, mas é garantido que você não escreverá postagens tão superficiais depois de se comunicar comigo. Além disso, você será muito mais cuidadoso em contas reais.

Aprendizado de máquina no Regressão Bayesiana - Alguém Pesquisa em pacotes matriciais

Дмитрий 2014.12.18 19:16 #89

faa1947:

1. formamos um conjunto bastante grande de preditores, por exemplo, 50 peças com o número de barras 15000.

Bem, agora está claro por que você ganha dinheiro vendendo seu livro e não negociando.

TheXpert 2014.12.18 20:08 #90

faa1947:

Essas são grandes ilusões e, pelo que sei, ainda não foram pagas por você. O modelo fornecido no artigo tem resultados igualmente bons em três amostras fora do treinamento, mas esse modelo está treinado em excesso.

Excesso de treinamento é um termo bem estabelecido e bastante específico. Você não está apenas substituindo-o, mas também não está explicando o que ele significa em seu entendimento.

A maneira como você fala lembra muito a de Sulton.

Reflexões sobre alguns dos FOREX - Tendências, previsões Broker's ; Eles estão

Discussão do artigo "Florestas Aleatórias na Previsão das Tendências" - página 9