La etiqueta del mercado o los buenos modales en un campo de minas - página 89

 
paralocus писал(а) >>
Creo que la longitud de la muestra de entrenamiento no puede ser sólo una función de la configuración de la red (número de entradas y número de neuronas), tal vez habría que tener en cuenta alguna característica de las filas en las que queremos entrenar la red.

Esto es posible si la PA es no estacionaria y la corrección estará determinada por la naturaleza de la no estacionariedad. Sin embargo, todavía estamos lejos de la corrección: no conocemos el tipo de dependencia de la longitud de la muestra con el número de pesos y la dimensionalidad de la entrada NS. Intuitivamente, creo que la visión general será así: P=4*w, y esto es cierto para cualquier arquitectura de NS.

Fedor, ¿qué dices de mi "epifanía" sobre el problema de la predicción binaria de la PA? Al fin y al cabo, el hecho de que para este caso especial de BP podamos utilizar el análisis estadístico como motor de predicción con la misma eficacia que NS, nos desata por completo en cuanto a la intensidad de los recursos del proceso. Creo que esto es un gran avance. Donde los comerciantes "incomprendidos" dedican tiempo y esfuerzo a entrenar NS de cinco capas con arquitectura adaptativa, lo único que necesitan es reunir estadísticas y no retorcerse (como decía Lenin).

 
Neutron >> :

Esto es posible si la PA es no estacionaria y la corrección estará determinada por la naturaleza de la no estacionariedad. Sin embargo, todavía estamos lejos de la corrección: no conocemos el tipo de dependencia de la longitud de la muestra con el número de pesos y la dimensionalidad de la entrada NS. Intuitivamente, creo que la visión general será así: P=4*w, y esto es cierto para cualquier arquitectura de NS.

Fedor, ¿qué dices de mi "epifanía" sobre el problema de la predicción binaria de la PA? Al fin y al cabo, el hecho de que para este caso especial de BP podamos utilizar el análisis estadístico como motor de predicción con la misma eficacia que NS, nos desata por completo en cuanto a la intensidad de los recursos del proceso. Creo que esto es un gran avance. Donde los comerciantes "incomprendidos" dedican tiempo y esfuerzo a entrenar NS de cinco capas con arquitectura adaptativa, lo único que necesitan es reunir estadísticas y no retorcerse (como decía Lenin).

Te digo, Sergey, que parece más que tentador. Ahora me he retirado de las redes, porque estoy ocupado con los ticks y he evitado hasta ahora los Asesores Expertos a fondo en las redes con entradas binarias. Pero ahora tengo algo de tiempo libre, así que pienso volver a los experimentos con rejillas, incluyendo entradas binarias. Si puedes prescindir de las rejillas... es realmente un avance. Recuerdo que Prival, y no sólo Prival, sugirió la idea de una base de datos de patrones. Si un modelo estadístico permite crear una base de datos de este tipo, el Asesor Experto sería infantilmente sencillo pero maduramente eficaz. Por cierto, tal vez no debamos alejarnos de las rejillas en absoluto, la rejilla debería simplemente cambiar su tarea: en lugar de pronosticar el próximo informe, puede ocuparse del reconocimiento de patrones; en mi opinión, la tarea tiene mucha más perspectiva y se ajusta muy bien a los sistemas de lógica difusa. ¿Qué te parece?

 
Neutron писал(а) >>

...utilizar el análisis estadístico como máquina de previsión, lo que nos liberaría considerablemente en cuanto a la intensidad de recursos del proceso. Creo que es un avance...

Por qué no usar:

- Reglas de la Asamblea o

- ¿Cohonnen?

Dan la misma probabilidad y apoyo.

 

¡Ese es el espíritu! Hace tiempo que no vengo por aquí. Ya tiene 90 páginas). Cuando vosotros también conseguís hacer parrillas, es increíble).

 
M1kha1l писал(а) >>

Por qué no usar:

- Reglas de la Asamblea o

- ¿Cohonnen?

Dan la misma probabilidad y apoyo.

¿Por qué?

Al fin y al cabo, en el caso de los datos de entrada binarios, este trabajo puede resolverse igualmente mediante patrones de análisis estadístico. Júzgalo tú mismo: sin problemas de formación y búsqueda de la arquitectura óptima. Como bien señaló paralocus, "el Asesor Experto sería infantilmente simple pero maduramente eficiente".

 

Después de haber iniciado los experimentos con entradas binarias, hay una pregunta. Ya lo he preguntado una vez, pero lo repetiré:

Si alimento las entradas con los signos de la primera serie de diferencia de PT, entonces debería predecir exactamente el enak del siguiente incremento...

A continuación se muestra mi código de una capa (comenzado con él hasta ahora) y este código toma la amplitud, no el signo, como un error en la salida de la rejilla, aunque es el signo que se utiliza en el cálculo OUT sí mismo. ¿Es correcto? ¿No debería ser el error también un signo, o al menos (por supuesto, no hay nada que hacer con el extremo fino...) una amplitud suficiente para obtener el signo apropiado en la salida?


 
paralocus писал(а) >>

Te digo, Sergey, que parece más que tentador. Ahora me he distanciado un poco de las rejillas en sí, porque tomé ticks y hasta ahora he evitado los Asesores Expertos fundamentales en rejillas con entradas binarias. Pero ahora tengo algo de tiempo libre, así que pienso volver a los experimentos con rejillas, incluyendo entradas binarias. Si puedes prescindir de las rejillas... es realmente un avance. Recuerdo que Prival, y no sólo Prival, sugirió la idea de una base de datos de patrones. Si un modelo estadístico permite crear una base de datos de este tipo, el Asesor Experto sería infantilmente sencillo pero maduramente eficaz. Por cierto, tal vez no debamos alejarnos de las rejillas en absoluto, la rejilla debería simplemente cambiar su tarea: en lugar de pronosticar el próximo informe, puede ocuparse del reconocimiento de patrones; en mi opinión, la tarea tiene mucha más perspectiva y se ajusta muy bien a los sistemas de lógica difusa. ¿Qué te parece?

Estoy sorprendido :) Sois unos tipos listos, pero mirad la mitad. En la entrada del experto en este esquema debe estar la misma base de datos con las estadísticas del patrón. Bueno, ¿cuántos patrones piensas poner ahí?

¿Todos ellos? Buena suerte... :) Y si no son todos, ¿cuántos exactamente? ¿Y cómo es que esta tarea es más fácil que la del NS?

El experto seguramente será rápido al final. Sólo hay que alimentarlo con "verdades" de la base de datos, que, por cierto, no son ciertas cuando se prueban. No Fuzzy ayudará a extraer la mermelada del futuro de la basura del pasado (DB).

// Wapcheta, para ser honesto - lo he comprobado. Hace aproximadamente un año y medio.

// Sólo que el esquema era más elegante. Después de pensarlo detenidamente y de forma creativa, elaboré la siguiente forma: si en un momento dado // tengo que tomar una decisión sobre una patente, no puedo hacerlo.

// Necesito tomar una decisión sobre un patrón que tengo en tiempo presente, no necesito una gigabase con

// una gigabase con un montón de patrones irrelevantes??? Tomo el patrón actual ahora mismo de la estufa y lo recorro a través de la historia,

// Recogiendo estadísticas a medida que avanzo. Después de recogerlo, lo utilizo inmediatamente. La dimensionalidad del problema disminuye en x^n

// veces, donde n=número de patrones en la base de datos. Huh.

// Lo hizo. Tengo los resultados. En general

// Negativo, aunque he descubierto alguna meta-ley en el camino. No te diré lo que es, siento decirlo. Porque...

// no es en absoluto un patrón obvio, hay que verlo. Así que hazlo tú mismo. Buena suerte. (sin ironía)

// Resumiré una vez más: no obtendrás el resultado esperado en este esquema. Pero puedes conseguir una especie de "satori".

// Puede darle algunas pistas para entender la naturaleza del mercado como un metasistema de aprendizaje. Lo cual es bueno.

 
MetaDriver >> :

>> es divertidísimo).


¿Tenía Mogit prisa? El que ríe último, dicen los vaqueros...

No creo que haya una gran DB aquí. Como mucho un centenar y medio de patrones, y muy probablemente incluso menos. Debes haber estado manejando tu sistema a la luz de las velas...

 
paralocus писал(а) >>

Después de haber iniciado los experimentos con entradas binarias, hay una pregunta. Ya lo he preguntado una vez, pero lo repetiré:

Si alimento las entradas con los signos de la primera serie de diferencia de PT, entonces debería predecir exactamente el enak del siguiente incremento...

A continuación se muestra mi código de una capa (comenzado con él hasta ahora) y este código toma la amplitud, no el signo, como un error en la salida de la rejilla, aunque es el signo que se utiliza en el cálculo de OUT en sí. ¿Es correcto? ¿No deberíamos utilizar como error también un signo, o en el peor de los casos (por supuesto, no hay nada que hacer con el peor de los casos...) la amplitud es suficiente para obtener el signo apropiado en la salida?

La razón principal de la transición al PB binario es el posible rechazo de los procedimientos de racionamiento y blanqueo de las entradas para el NS y lo más importante - la transición del valor continuo analizado (número infinito de valores) al binario, que toma sólo dos valores +/-1. Esto supone un importante ahorro de recursos informáticos. La red en sí está entrenada por el método ORO y para ello genera un error definido en el área de los números reales (no discretos), por lo que, paralelamente, dando entrada +/-1 se obtendrá en la salida un valor en el rango de -1 a 1 con paso 10^-8. Y sólo cuando la red haya terminado de entrenarse, deberá utilizar el signo del movimiento predicho para la predicción, y su amplitud, será proporcional a la probabilidad de predicción correcta (la amplitud es siempre positiva). Esta probabilidad puede utilizarse para un análisis adicional en el bloque MM.

Toda la ventaja de NS en comparación con otros métodos de análisis de BP es la posibilidad de construcción no analítica (no explícita) de la superficie multidimensional en el espacio de datos de entrada "muy escasos", a la que se "atraen" los valores iniciales de BP (la primera diferencia de kotir). En el caso de la representación binaria, se trata de una hipersuperficie, que se degenera en un hipercubo multidimensional. Esto es como un cristal, que no tiene superficie, pero hay nodos de su red cristalina (en sentido figurado), conocemos las coordenadas de estos nodos al minuto y no necesitamos gastar nuestros recursos en la detección de la superficie... La red es innecesaria.

Razón de la queja: