¿Qué alimentar a la entrada de la red neuronal? Tus ideas... - página 75

 
Hola.

Voy a poner mis cinco centavos sobre el tema.
No juzgues estrictamente.

1. Utilice la metodología de "enseñar con ejemplos".
El número de ejemplos de entrenamiento debe ser limitado, no toda la historia previsible.
De lo contrario, el "cerebro" de la red será un desastre, mientras que las respuestas de la red entrenada deberían correlacionarse bien con las respuestas correctas conocidas al menos para los ejemplos con los que se entrenó.
En realidad, este es el propósito del entrenamiento de cualquier red, cuando hablamos de entrenar sobre unos datos obviamente disponibles.

2. Los ejemplos de entrenamiento se preparan a partir de un cierto número limitado de historias h mediante el método de "ventana de rastreo" que tiene el tamaño de un cierto número de valores k.
En otras palabras, el número de ejemplos de entrenamiento (cada uno de tamaño k) es igual a h, donde k y h están preestablecidos.
Como el número de ejemplos de entrenamiento es limitado, cuando aparece un nuevo ejemplo a la derecha y desaparece uno antiguo a la izquierda, el contenido del paquete de entrenamiento también cambia, lo que significa que la red debe volver a entrenarse completamente de nuevo.
De este modo, la red nunca recuerda demasiado lo antiguo y se vuelve a entrenar regularmente con lo nuevo.

3. Como regla general, cuando se aprende a partir de ejemplos, cada ejemplo de entrenamiento debe ir acompañado de una respuesta correcta conocida.
En el contexto de un sistema antípoda (compra o venta), el valor de la respuesta correcta conocida debe estar comprendido entre -1 y +1.
Con un valor positivo de la respuesta se proporciona un ejemplo de aprendizaje para comprar, y con un valor negativo de la respuesta se proporciona un ejemplo de aprendizaje para vender.
Lo que exactamente debe actuar como una respuesta correcta conocida, especialmente en el rango de -1 a +1, tal vez, no voy a difundir ahora.
Sin embargo, repetiré que después del entrenamiento, las respuestas de la red deberían correlacionarse bien con las respuestas correctas conocidas, al menos cuando a la red se le presentan los ejemplos con los que fue entrenada.
Comprobar la presencia de tal correlación (prueba de la red) es un procedimiento obligatorio, de lo contrario es imposible afirmar que la red ha aprendido algo adecuado y no se ha "cabreado".

4. Como imagen de un ejemplo de entrenamiento, podemos utilizar un cierto número de k valores de diferencias de precios de cierre y apertura normalizados en el rango de -1 a +1, relativos al máximo (módulo) de estos k valores.
Un ejemplo de entrenamiento de este tipo contiene números positivos y negativos, que tienen todo el derecho a ser de signo opuesto a un ejemplo similar, pero reflejado.
Basándonos en las consideraciones del reflejo, aquellos signos que son adecuados para la compra no son adecuados para la venta, pero serán adecuados para ella estando en forma de espejo, y viceversa.
El concepto de mirroring sugiere que la red debe dar respuestas en el rango de -1 a +1, como antípodas, ya sea de venta o de compra.
Si el valor de la respuesta de la red está por encima del umbral, por ejemplo +0,8, entonces es una compra, o si el valor de la respuesta de la red está por debajo del umbral, por ejemplo -0,8, entonces es una venta.

5. Además de la imagen del precio, no debe descuidarse la imagen de los volúmenes, incluso de los volúmenes de los ticks.
No es importante si el volumen es tick o real, sólo es importante que la escala de volumen tenga fluctuaciones sessionales y diarias pronunciadas, lo que significa que al menos no es inútil.
Sin embargo, los valores de volumen son unipolares y no entran en el concepto de mirroring, por lo que habría que pensar detenidamente cómo utilizarlos en una red con respuesta bipolar.
Por ejemplo, dos situaciones, precio sube/volumen sube, precio baja/volumen sube, son especulares, pero el componente especular aquí es sólo el precio, y el volumen sigue siendo él mismo.
Pero, por ejemplo, el delta de los volúmenes (si existe) es totalmente coherente con el principio del espejo.
En este punto sólo quiero hacer hincapié en que no todos los datos son antipodales por naturaleza, pero algunos de ellos deben seguir siendo ellos mismos (no reflejados), al menos para la compra, al menos para la venta.
Sin embargo, la fórmula de retropropagación de errores no sabe de tales peculiaridades ...

 
Evgeny Shevtsov #:
Hola.


Voy a poner mis cinco centavos sobre el tema. ...

Gracias, sustantivo

 
Paradigma de búsqueda:

Objetivo - no es la próxima vela ordinal o la próxima lectura ordinal.

El objetivo es el resultado de una operación desde el momento actual.

Es decir

1) Tomamos cualquier estrategia. Esperamos su activación (apertura de posición). Registramos un conjunto de entradas (cualquiera). Monitorizamos la posición hasta su cierre, y registramos el resultado de la operación como objetivo.

2) La entrenamos utilizando cualquier método.

3) Ejecutar nuestra estrategia (pomoichny).

4) Añadir un filtro a la misma - nuestra NS.


Como resultado, tenemos que poner un poco de esfuerzo intelectual, creativo, paciencia y tiempo para recoger la estrategia.

El resto lo hará la red neuronal.

Quitamos a la red neuronal el duro trabajo intelectual simplemente porque en las realidades actuales el NS ni siquiera es capaz de determinar los niveles, si no los marca "por sí mismo".

Y hará lo que se supone que debe hacer: triturar el ST.
 
Ivan Butko #:
Paradigma de búsqueda: ...


Toda estrategia de negociación consiste en que tal o cual acción de negociación se realice sólo en tal o cual circunstancia (o conjunto de circunstancias).

Si esto no se cumple, no es una estrategia.


Por lo tanto, la siguiente hipótesis (suposición) es inevitable:

Si se obtuvo un determinado resultado en una circunstancia determinada, entonces existe la expectativa de que en la misma circunstancia (o en una muy similar) se obtendrá el mismo resultado.


La fórmula de la retropropagación de errores está diseñada de tal forma que, en el proceso de su aplicación, la "circunstancia sobre las entradas X" se traslada (resume/resume) a los "valores de ponderación W".

En otras palabras, los valores de ponderación son simplemente la suma de muchas circunstancias, cada una de las cuales se ha sumado con su propio coeficiente-valor.

Donde la cifra del coeficiente es el resultado de una determinada acción comercial realizada en una determinada circunstancia.

Así que, en términos generales, aunque la fórmula es un poco más complicada...


1. Si bajo dos circunstancias similares se obtienen dos resultados comerciales contradictorios, entonces durante el procedimiento de propagación inversa del error estas circunstancias se extinguen mutuamente (pasando de X a W).

2. 2. Si bajo dos circunstancias antisimilares (espejo) se obtuvieran dos resultados comerciales similares (en valor y en signo), entonces bajo el procedimiento de la propagación inversa del error estas circunstancias también se anulan mutuamente.

3. si se han obtenido dos resultados comerciales similares (en valor y en signo) bajo dos circunstancias similares, entonces estas circunstancias se suman entre sí durante el procedimiento de propagación inversa del error.


Y aquí es obvio que la red neuronal simplemente capta la relación entre las circunstancias y sus resultados de negociación, es decir, detecta patrones.

Y no sólo detecta, sino que también los refresca en el proceso de recepción de nuevos antecedentes.


Si, claro, hay algo en el punto 3, en contra del punto 1 y del punto 2...


Bueno, y juguetear con la red neuronal se puede iniciar sólo con la aceptación inequívoca de la hipótesis anterior.

Y puede resultar ser errónea. ))


En cuanto a la eliminación de un solo resultado comercial como una estimación de una sola circunstancia en la que se obtuvo este resultado, creo que para diferentes circunstancias las estimaciones deben ser iguales.

Es decir, debe cumplirse la misma "otra condición de igualdad" para diferentes circunstancias.

Sólo un factor puede ser tal condición, el intervalo de tiempo de la retención de la operación.

 
Evgeny Shevtsov #:

...


Por lo tanto, la siguiente hipótesis (suposición) es inevitable : ...





Absolutamente de acuerdoTienes razón: tengo - hipótesis, suposiciones y fantasías . La rama, en principio, sobre el mismo.




Qué pensar, cómo envolver . Y si hay alguna explicación, razón, motivo - es aún más interesante. En cuanto a NS, mi actitud hacia ellos es la siguiente: es una caja con un conjunto de reglas "si, si no". Por lo demás, no. Incluso si el sistema es adaptativo, el propio proceso de adaptación es una regla "si esto, entonces aquello".



De lo contrario, es un proceso aleatorio. Y teniendo en cuenta que el mercado se esfuerza o es completamente único, mi cabeza se ahoga en paradojas: cualquier intento de explicar la existencia de regularidades eternas (incluidas las regularidades en los mecanismos de adaptación, es decir, el cambio/la reoptimización/el reaprendizaje) se empantana en la imposibilidad y divaga en el caos . Como resultado: me limito a indagar en los sistemas simples a pesar de ellos. Ojeo los resultados de los complejos, si aparecen artículos.
 
Evgeny Shevtsov #:

En cuanto a la eliminación de un resultado comercial como valoración de la circunstancia en la que se obtuvo dicho resultado, creo que para circunstancias diferentes las valoraciones deberían ser iguales.

Es decir, debería observarse la misma llamada "otra condición igual" para diferentes circunstancias.

Sólo un factor puede actuar como tal condición, el intervalo de tiempo de la retención de la operación.

La esencia del uso de la estrategia es recibir una señal en condiciones de mercado similares (patrón global), por lo que los indicadores de los predictores describen este momento del evento, no todo el mercado, lo que, en teoría, reduce las contradicciones dentro de ellos con el objetivo. En definitiva, el aprendizaje consiste en encontrar elementos de las reglas que refuercen o reduzcan el patrón original. El inconveniente de este enfoque es la importante reducción de ejemplos en la muestra.

En cuanto al recargo por tiempo, también es dudoso, ya que nos interesa el vector de movimiento del precio en el trading, o mejor incluso la trayectoria, por lo que lo ideal sería que el recargo tuviera en cuenta no sólo dónde estará el precio en n compases, sino también cómo llegará hasta allí.

 
Aleksey Vyazmikin #:
por lo que lo ideal sería que el margen de beneficio tuviera en cuenta no sólo dónde estará el precio en n barras, sino también cómo llegará hasta allí.

"El inconveniente de este enfoque es una reducción significativa de ejemplos en la muestra".

Estoy de acuerdo, es así.

Pero por lo demás es "papilla".


"... así que lo ideal sería que el margen de beneficio tuviera en cuenta no sólo dónde estará el precio en n barras, sino también cómo llegará hasta allí".

De ahí obtenemos la llamada puntuación R/S, cuyo valor oscila entre -1 y +1, donde :

- S es la trayectoria total, es decir, la longitud de la trayectoria,

- R es el recorrido neto, es decir, la distancia entre el punto inicial de la trayectoria y el punto final de la misma, que puede ser negativa.

Pero para que el conjunto de estimaciones obtenidas de este modo sean iguales entre sí, hay que tomar igual el intervalo de tiempo T aplicado para obtener cada estimación.

Y hay que decir que tal estimación sigue sin ser autosuficiente.

RS

 
Evgeny Shevtsov #:

"El inconveniente de este enfoque es la reducción significativa de ejemplos en la muestra".

Estoy de acuerdo.

Pero por lo demás es "papilla".


"... así que lo ideal sería que el margen de beneficio tuviera en cuenta no sólo dónde estará el precio en n bares, sino también cómo llegará hasta allí."

De ahí obtenemos la llamada estimación R/S, cuyo valor oscila entre -1 y +1, donde :

- S es la trayectoria completa, es decir, la longitud de la trayectoria,

- R es la trayectoria neta, es decir, la distancia entre el punto inicial de la trayectoria y el punto final de la misma, que puede ser negativa.

Pero, para que el conjunto de estimaciones obtenidas de este modo sean iguales entre sí, el intervalo de tiempo T aplicado para obtener cada estimación debe tomarse igual.



RS Y hay que decir que tal estimación sigue sin ser autosuficiente.

Falta la lectura de la amplitud/anchura máxima. Es como si faltara
 
Ivan Butko #:
En cuanto a las NS, mi actitud hacia ellas es que son una caja con un conjunto de reglas "si, si no". Así son las cosas.

La verdad es que no.

Más bien ni siquiera es así en absoluto.

))

 
Evgeny Shevtsov #:

La verdad es que no.

Más bien en absoluto.

))








Chat me contradijo lo mismoY cuando hice la pregunta: "Si después del entrenamiento la entrada es 1 y la salida es 2, ¿corresponde a la regla "si la entrada es 1, la salida es 2" - incluso Dipsic tuvo que estar de acuerdo" .Se trata más bien de la esencia de la caja. Intenta responder a la misma pregunta.