rete neurale e ingressi - pagina 38

 

Buon pomeriggio.

Non solo. Io uso ada, randomForest (in varie varianti), C50 e altri. Ma i migliori risultati, ovviamente, vengono da ada e rfNear() di CORElearn. Il tanto decantato svm non ha mostrato alcun vantaggio (tranne il fatto che ci vuole molto tempo per imparare). Senza sminuire la sua importanza, forse non sono riuscito a cucinarlo bene?

La sequenza di lavoro è la seguente.Controllare la significatività deidati di input, determinare i parametri ottimali per ogni modello. Calcolo con tre diversi modelli con calibrazione, decisione con voto semplice. Con un campione iniziale di 1000 barre, il modello funziona stabilmente con 250 barre senza riqualificazione. Controllo e stima della precisione.

Ci sono pacchetti che stimano l'influenza dei metodi di pre-elaborazione sul risultato e selezionano il migliore, oltre alla valutazione dei dati di input utilizzando metodi di componenti principali. Non li ho ancora padroneggiati, perché non ho abbastanza tempo. Ma continuerò a studiarli.

Buona fortuna.

 
grell:

Quali segnali di ingresso pensate che portino informazioni utili:)

Vedere il PDF nell'archivio allegato: p. 17 Riduzione dei predittori insignificanti...


C'è un semplice esempio lì, che mostra chiaramente che il metodo ricampiona correttamente solo gli input che non sono variabili esplicative nel campione di allenamento.

 
HMM... Interessante, ho scaricato il progetto dal link nel libro ma non so come eseguirlo. Puoi darmi un suggerimento?
 
E quando viene aperto tramite java. Dice che non c'è Jproject class.... Come questo....
 

Ecco una finestra come questa....

 
nikelodeon:
HMM... Interessante, ho scaricato il progetto dal link nel libro, ma come eseguirlo non lo so. Puoi dirmelo?

È possibile che la versione di Java sul tuo computer non sia aggiornata? Ho compilato il progetto sotto la versione 1.8.0_25

Scaricare l'ultima versione di Java2SE (JRE o JDK) da: http: //java.com/ru/

 

Grande, tutto funziona, ma non è chiaro in quale forma i dati devono essere presentati.... È chiaro che .csv Well, come devono essere disposti, ecc.

Se potete mandarmi un file di dati con un esempio....

 
nikelodeon:

Grande, tutto è pronto e funzionante, ma non è chiaro in che forma i dati dovrebbero essere .... È chiaro che .csv Well, come dovrebbero essere disposti, ecc.

Se potete inviare il file di dati con l'esempio a....

vedere. Previsione di fallimento.

C'è un file CSV allegato con un esempio di classificazione.

In breve:

Il separatore di celle è un punto e virgola.

Separatore della parte intera dalla parte frazionaria per i numeri: punto o virgola (tutte le virgole sono automaticamente sostituite da punti).

La prima colonna - esempi identificativi (in forma testuale)

Ultima colonna - valori della variabile dipendente: 1 - appartenente a una data classe, 0 - appartenente a una classe non definita (qualsiasi classe diversa da quella data)

Prima riga - identificatori di fattori (in forma testuale)

Seconda riga - note sugli identificatori dei fattori, per esempio, unità di misura (come testo)

I dati rimanenti sotto la seconda riga, a destra della prima colonna e a sinistra dell'ultima colonna sono valori numerici dei fattori (i non numerici non vengono elaborati).

 
Naturalmente la mia formula era più semplice e non avevo molti dati, ma come la interpreto? Non capisco :-(.
 

Capisco. La prima trasformazione è la normalizzazione dei dati di ingresso, dopo la normalizzazione sostituisco i dati nella formula e ottengo il risultato di COSA? Cioè, metto i dati normalizzati nella formula e ottengo la curva dell'indicatore secondo la formula? Perché dovrei mettere un segno >0?

è un po' poco chiaro :-(

Motivazione: