rede neural e entradas - página 38

 

Boa tarde.

Não apenas isso. Eu uso ada, randomForest (em várias variantes), C50 e outros. Mas os melhores resultados, naturalmente, vêm da ada e rfNear() da CORElearn. O altamente elogiado svm não mostrou nenhuma vantagem (exceto que leva muito tempo para aprender). Sem menosprezar sua importância, talvez eu não conseguisse cozinhá-lo direito?

A seqüência de trabalho é a seguinte.Verificar a significância dosdados de entrada, determinar os parâmetros ótimos para cada modelo. Cálculo por três modelos diferentes com calibração, decisão por simples votação. Com uma amostra inicial de 1000 barras, o modelo funciona de forma estável com 250 barras, sem necessidade de reciclagem. Controle de exatidão e estimativa.

Há pacotes que estimam a influência dos métodos de pré-processamento no resultado e selecionam o melhor, além da avaliação dos dados de entrada usando os métodos dos componentes principais. Eu ainda não os dominei, pois não tenho tempo suficiente. Mas vou continuar estudando-as.

Boa sorte.

 
grell:

Quais sinais de entrada você acha que trazem informações úteis?:)

Ver PDF no arquivo anexo: p. 17 Redução de preditores insignificantes...


Há ali um exemplo simples, que mostra claramente que o método reduz corretamente apenas as entradas que não são variáveis explicativas na amostra de treinamento.

Arquivos anexados:
 
HMM... Interessante, baixei o projeto do link do livro, mas não sei como executá-lo. Você pode me dar uma dica?
 
E quando aberto via java. Diz que não há Jproject class.... Como esta....
 

Aqui está uma janela como esta....

 
nikelodeon:
HMM... Interessante, baixei o projeto do link do livro, mas como executá-lo, não sei. Você pode me dizer???

É possível que a versão de Java em seu computador esteja desatualizada? Eu compilei o projeto sob a versão 1.8.0_25

Baixe a última versão do Java2SE (JRE ou JDK) de: http: //java.com/ru/

 

Ótimo, tudo está funcionando, mas não está claro de que forma os dados devem ser apresentados.... Está claro que .csv Bem, como eles devem ser organizados, etc.

Se você puder me enviar um arquivo de dados com um exemplo....

 
nikelodeon:

Ótimo, tudo está pronto e funcionando, mas não está claro de que forma os dados devem estar em.... Está claro que .csv Bem, como eles devem ser organizados, etc.

Se você puder enviar o arquivo de dados com o exemplo para....

ver. Previsão de falência.

Há um arquivo CSV anexo com um exemplo para classificação.

Em resumo:

O separador de células é um ponto-e-vírgula.

Separador de parte inteira da parte fracionária para números: ou ponto ou vírgula (todas as vírgulas são automaticamente substituídas por paradas completas).

A primeira coluna - exemplos de identificadores (em forma textual)

Última coluna - valores de variável dependente: 1 - pertencente a uma determinada classe, 0 - pertencente a uma classe indefinida (qualquer classe que não seja a dada)

Primeira linha - identificadores de fatores (em forma textual)

Segunda linha - notas sobre identificadores de fatores, por exemplo, unidades de medida (como texto)

Os dados restantes abaixo da segunda linha, à direita da primeira coluna, e à esquerda da última coluna são valores numéricos de fatores (não-numéricos não são processados).

 
Claro que minha fórmula era mais simples, e eu não tinha muitos dados, mas como interpretar isso? Eu não entendo :-(.
 

Estou vendo. A primeira transformação é a normalização dos dados de entrada, após a normalização eu substituo os dados na fórmula e recebo o RESULTADO DO QUE? Quero dizer, eu coloco os dados normalizados na fórmula e obtenho a curva do indicador de acordo com a fórmula??? Por que eu deveria colocar um sinal >0???

é um pouco obscuro :-(

Razão: