red neuronal y entradas - página 38

 

Buenas tardes.

Y no sólo eso. Utilizo ada, randomForest (en varias variantes), C50 y otros. Pero los mejores resultados, por supuesto, vienen de ada y rfNear() de CORElearn. El tan alabado svm no ha demostrado ninguna ventaja (salvo que tarda mucho en aprender). Sin menospreciar su importancia, tal vez no podría cocinarlo bien.

La secuencia de trabajo es la siguiente.Compruebe la significación delos datos de entrada y determine los parámetros óptimos para cada modelo. Cálculo mediante tres modelos diferentes con calibración, decisión por votación simple. Con una muestra inicial de 1000 bares, el modelo funciona de forma estable con 250 bares sin necesidad de reentrenamiento. Controles y estimaciones de precisión.

Existen paquetes que estiman la influencia de los métodos de preprocesamiento en el resultado y seleccionan el mejor, además de la evaluación de los datos de entrada mediante métodos de componentes principales. Todavía no los domino, ya que no tengo suficiente tiempo. Pero seguiré estudiándolos.

Buena suerte.

 
grell:

¿Qué señales de entrada crees que llevan información útil?:)

Ver PDF en el archivo adjunto: p. 17 Reducción de los predictores insignificantes...


Hay un ejemplo sencillo que muestra claramente que el método reduce correctamente el muestreo de las entradas que no son variables explicativas en la muestra de entrenamiento.

Archivos adjuntos:
 
HMM... Interesante, he descargado el proyecto desde el enlace del libro, pero no sé cómo ejecutarlo. ¿Puedes darme una pista?
 
Y cuando se abre a través de java. Dice que no hay Jproject class.... Así....
 

Aquí hay una ventana como esta....

 
nikelodeon:
HMM... Interesante, descargué el proyecto desde el enlace del libro, Pero cómo ejecutarlo no lo sé. ¿Puedes decirme?

¿Es posible que la versión de Java de su ordenador esté desfasada? He compilado el proyecto bajo la versión 1.8.0_25

Descargue la última versión de Java2SE (JRE o JDK) desde: http: //java.com/ru/

 

Genial, todo está funcionando, pero no está claro en qué forma los datos deben ser presentados.... Está claro que .csv Bueno, cómo deben ser ordenados, etc.

Si puede enviarme un archivo de datos con un ejemplo....

 
nikelodeon:

Estupendo, todo está en marcha, pero no está claro en qué forma deben estar los datos.... Está claro que los .csv bien, cómo deben estar ordenados, etc.

Si puede enviar el archivo de datos con el ejemplo a ....

ver. Previsión de quiebra.

Hay un archivo CSV adjunto con un ejemplo de clasificación.

En resumen:

El separador de celdas es un punto y coma.

Separador de la parte entera de la parte fraccionaria para los números: punto o coma (todas las comas se sustituyen automáticamente por puntos).

La primera columna - ejemplos de identificadores (en forma de texto)

Última columna - valores de la variable dependiente: 1 - perteneciente a una clase determinada, 0 - perteneciente a una clase indefinida (cualquier clase distinta de la dada)

Primera línea - identificadores del factor (en forma de texto)

Segunda línea - notas sobre los identificadores de los factores, por ejemplo, unidades de medida (como texto)

Los datos restantes debajo de la segunda fila, a la derecha de la primera columna y a la izquierda de la última columna son valores numéricos de los factores (los no numéricos no se procesan).

 
Por supuesto, mi fórmula era más sencilla y no tenía muchos datos, pero ¿cómo la interpreto? No lo entiendo :-(.
 

Ya veo. La primera transformación es la normalización de los datos de entrada, después de la normalización sustituyo los datos en la fórmula y obtengo el RESULTADO de ¿QUÉ? Es decir, pongo los datos normalizados en la fórmula y obtengo la curva del indicador según la fórmula? ¿Por qué debo poner un signo >0?

es un poco confuso :-(

Razón de la queja: