rede neural e entradas - página 39

 

A qualidade da modelagem fora da amostra:
*
* TruePositives: 83
* TrueNegative: 111
* FalsePositivos: 96
* FalseNegative: 47
* Total de padrões em amostras com estatísticas: 337
* O restante dos padrões em fora das amostras sem as estatísticas: 78
* Total de erros de entrada fora da amostra: 143
* Sensibilidade de generalização abiliy: 46,36871508379888%
* Especificidade da capacidade de generalização: 70,25316455696202%
* Capacidade de generalização: 16,621879640760895%
* Indicador por Reshetov: 0,00412318318459131376475
*/
duplo x0 = 2,0 * (v0 - 19,0) / 35,0 - 1,0;
duplo x1 = 2,0 * (v1 - 12,26) / 57,8300000000005 - 1,0
duplo x2 = 2,0 * (v2 - 21,0) / 13,0 - 1,0
duplo x3 = 2,0 * (v3 - 12,11) / 24,3800000000003 - 1,0
duplo x4 = 2,0 * (v4 - 18,0) / 40,0 - 1,0
duplo x5 = 2,0 * (v5 - 11,61) / 58,5 - 1,0;
dupla decisão = -0,03426154451479057 + 0,09136531101334192 * x0 -0,16115463032514218 * x1 + 0,3774761240476446 * x0 * x1 -0.149536367886396967 * x2 -0,2182655506670959 * x0 * x2 -0,686972851164288 * x1 * x2 -0,7274492971348857 * x0 * x1 * x2 -0,06979110777265085 * x3 + 0.27356476016739995 * x0 * x3 -0,026662374360625248 * x1 * x3 + 0,12474514432879064 * x0 * x1 * x3 -0,291989483838501985 * x2 * x3 -0,2863737167793397 * x0 * x2 * x3 + 0.04656257824516221 * x1 * x2 * x3 + 0,11427907143112637 * x0 * x1 * x2 * x3 + 0,01709410880995815 * x4 + 0,21856958901169654 * x0 * x4 -9.92595777720785493E-4 * x1 * x4 + 0,9723342991021926 * x0 * x1 * x4 + 0,04599384769467396 * x2 * x4 -0,05459813284687198 * x0 * x2 * x4 + 0.37290192411918918303 * x1 * x2 * x4 + 0,010296169116858033 * x0 * x1 * x2 * x4 + 0,058584612082841506 * x3 * x4 + 0,531371391780234 * x0 * x3 * x4 -0.025018778838931215 * x1 * x3 * x4 + 0,1861984476159817 * x0 * x1 * x3 * x4 + 0,07319097184962621 * x2 * x3 * x4 + 0,0968827127374181818 * x0 * x2 * x3 * x4 + 01411041957291555 * x1 * x2 * x3 * x4 + 0,16417712916264263 * x0 * x1 * x2 * x3 * x4 -0,1726597989770004 * x5 + 0,36239224523375185 * x0 * x5 -0.008892292292227349143328 * x1 * x5 -0,04417677147047251 * x0 * x1 * x5 -0,7319687377043317 * x2 * x5 -0,7806416997531924 * x0 * x2 * x5 + 0.01225632222209106843 * x1 * x2 * x5 + 0,04393711771649319 * x0 * x1 * x2 * x5 -0,006563651321672569 * x3 * x5 + 0,0627642424509067496 * x0 * x3 * x5 -0.015999570769395857 * x1 * x3 * x5 -0,05302786422005222 * x0 * x1 * x3 * x5 + 0,03534892871195049 * x2 * x3 * x5 + 0,1463193475694817 * x0 * x2 * x3 * x5 -0.027476124047644598 * x1 * x2 * x3 * x5 + 0,052884787352004865 * x0 * x1 * x2 * x3 * x5 -0,018202954537325178 * x4 * x5 + 1,0 * x0 * x4 * x5 -0.07118968415781378 * x1 * x4 * x5 -0,003138748792788926 * x0 * x1 * x4 * x5 + 0,2624137067639589 * x2 * x4 * x5 -0,02015595378617162 * x0 * x2 * x4 * x5 + 0.08019279607969382 * x1 * x2 * x4 * x5 + 0,06399649461673285 * x0 * x1 * x2 * x4 * x5 -0,02596308616804378 * x3 * x4 * x5 + 0.18361769860857746 * x0 * x3 * x4 * x5 -0,08407017017920377723 * x1 * x3 * x4 * x5 + 0,03014271917587724 * x0 * x1 * x3 * x4 * x5 + 0,07432306756805093 * x2 * x3 * x4 * x5 + 0.20722895875809277 * x0 * x2 * x3 * x4 * x5 + 0,0075079586507851345 * x1 * x2 * x3 * x4 * x5 + 0,20670493972886933 * x0 * x1 * x2 * x3 * x4 * x5

É complicado..... Como os dados descrevem bem a variável dependente????

 

Eu apresentei um arquivo de treinamento. Nenhum intervalo de teste ainda :-( Mas isso não é problema.....

E, tanto quanto entendi, foram necessárias 337 entradas, embora eu tenha apresentado 600.

Aqui, vou tentar reproduzir o resultado em meu ambiente. Qual será o resultado, mesmo em máquinas diferentes?

Arquivos anexados:
 
E sobre os dados não é muito claro como levá-los para treinar a rede sobre dados limpos..... Como selecionar TruePositives: TrueNegative: FalsePositives: FalseNegative da amostra de treinamento e tentar treinar a rede. Veja o que acontece. Normalização dos dados recebidos, isso é uma coisa boa.... Eu não sei como usar.... Só para que pareça bom...
 

O resultado corresponde....... Suponha que encontramos 83 exemplos realmente positivos. Como separá-los do total da amostra...... E alimentam estes 83 registros naturalmente normalizados. E se a rede aprender com um erro mínimo a estes 83 registros. Então poderá (teoricamente) classificar tais registros no ruído de entrada...... Como esta....

 
nikelodeon:

Eu apresentei um arquivo de treinamento. Nenhum intervalo de teste ainda :-( Mas isso não é problema.....

E, tanto quanto entendi, foram necessárias 337 entradas, embora eu tenha apresentado 600.

Aqui, vou tentar reproduzir o resultado em meu ambiente. Qual será o resultado, mesmo em máquinas diferentes?

A VMR divide a amostra total em duas partes: treinamento e controle. Ou seja, se a amostra total contém 600 exemplos, significa que 600 - 337 = 263 exemplos foram incluídos na amostra de treinamento, na qual o modelo foi criado (treinado), e 337 exemplos foram incluídos na amostra de controle, na qual o modelo foi então testado (mas não treinado).
nikelodeon:
E sobre os dados, não é muito claro como levá-los para treinar a rede sobre dados limpos..... Como extrair de um conjunto de treinamento TruePositives: TrueNegative: FalsePositives: FalseNegative e tentar treinar a rede.
Não há sentido em extrair nada do conjunto de treinamento. A amostra de treinamento é apenas para criar o modelo, e o modelo é para outros dados que não estarão nesta amostra, portanto a VMR faz todos os cálculos apenas na amostra de controle.
 

Na verdade, a JPrediction não foi criada para prever instrumentos financeiros, mas para prever a rentabilidade dos sinais para o mês seguinte.

Em outras palavras, compilarei uma amostra que inclui as características do sinal atual: número de negócios, prazo, lucro mensal %, porcentagem de negócios lucrativos, porcentagem de negócios perdedores, fator de lucro, relação de Sharp, etc. Então eu espero um mês e marco com 1 mês de negócios lucrativos e 0 não-lucrativos.

Então eu treino o modelo nesta amostra e o utilizo para prever sinais para o próximo mês.

A idéia é que os sinais são mais fáceis de prever porque têm muitas informações úteis adicionais além dos dados históricos. Os instrumentos financeiros não possuem dados adicionais além de dados históricos.

 
Wizard, que programa você usa para interpretar os dados? E-excel???
 

Então estou pensando... como interpretar o resultado... para torná-lo mais rápido e certamente não à mão........

 
Reshetov:

Na verdade, a JPrediction não foi criada para prever instrumentos financeiros, mas para prever a rentabilidade dos sinais para o mês seguinte.

Em outras palavras, compilarei uma amostra que inclui as características do sinal atual: número de negócios, prazo, lucro mensal %, porcentagem de negócios lucrativos, porcentagem de negócios perdedores, fator de lucro, relação de Sharp, etc. Depois espero um mês e marco 1 marca para sinais que tiveram lucro dentro de um mês, enquanto marco 0 marca para negócios não-lucrativos.

Então eu treino o modelo nesta amostra e o utilizo para prever sinais para o próximo mês.

A idéia é que os sinais são mais fáceis de prever porque têm muitas informações úteis adicionais além dos dados históricos. Os instrumentos financeiros não possuem dados adicionais além de dados históricos.

Apoio plenamente esse ponto de vista, tenho um indicador que dá sinais. Os mesmos ofícios. Acho que também pode ser possível executá-lo em JPrediction, mas não está claro como escolher o intervalo de treinamento? E seria conveniente salvar o arquivo com o indicador calculado para cada registro.....Como é feito pela Vizard...... E os próprios dados para que possam ser obtidos.... Neles você pode tentar treinar outra rede mais tarde..... É isso aí. Diz Yuri, isto está planejado????
 
O mais irritante é que o Excel também não suporta fórmulas tão longas :-(
Razão: