Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 1271

 
Se me ocurrió la idea de que sólo se puede esperar una distribución normal en procesos terminados (es sólo una idea - no lo he comprobado), y que el mercado no lo es, por lo que todas las suposiciones sobre su distribución desigual y su no estacionariedad son sólo especulaciones, que no se pueden comprobar mientras exista el mercado.
 
Maxim Dmitrievsky:

Para el mercado, se forma exactamente igual, porque la tecnología es la misma. Olvídate de la "influencia", no se enseña explícitamente en la forma en que la concibes. Hay conjuntos de estrategias, estrategias óptimas, etc. (en RL se llaman políticas).

Si tuviéramos un creador de bots podríamos hacerle una serie de preguntas y quedarnos muy sorprendidos con las respuestas. Todos estos RL son buenos para aprender las influencias ambientales estacionarias, pero si estás jugando contra otro jugador, entonces el RL desnudo no funcionará aquí. No he estudiado esta área en profundidad, puede que me equivoque. Pero hay una clara interacción con el entorno cambiante, no se puede ver desde el comportamiento de los bots no hay ninguna expectativa de nada, no se puede ver en absoluto, hay un control de la probabilidad de causar daño tanto a usted como a su oponente, y hay errores de cálculo simplemente y actuar hacia menos posibilidad de resultado negativo, pero no es la probabilidad dada por la política al principio del juego - es la influencia en el entorno cambiante.

 
Os he estado leyendo. Un par de posts y me di cuenta de que la teoría sigue y sigue. Pero te sorprenderás cuando empieces a practicar. Construir modelos y buscar nuevas soluciones no es nada comparado con el comercio real, cuando se configura todo, se pone en marcha y se espera ...... Entonces aparece la primera señal y el robot abre una operación. Pero lo peor es cuando se analiza el resultado de esta operación y su decisión (del robot). Seguirá ganando dinero o será el momento de cambiarlo. En mi experiencia suelo encontrar que después de la optimización hace una o tres operaciones perdedoras y luego empieza a subir. Y en esos momentos, tú también te pones a molestar y a revisar. Subirá o no. Esto significa que en el comercio real se enfrentan a problemas que nunca se pensó durante la búsqueda y optimización. Por lo tanto, cuanto antes empiece a practicar, más rápido se enfrentará a los problemas de un comerciante en activo. Naturalmente, I.M.O.
 
 
Vi el vídeo y el comentario en ruso, e incluso me sorprendió que tuviera una idea muy correcta del comportamiento: hay valoración de activos, hay probabilidad de resultado, hay microcontrol, y hay estrategias iniciales espurias para el desarrollo. Hay un énfasis muy fuerte en la selección de exactamente las unidades para luchar con la eficiencia de micro-control y aparentemente el más eficaz desde un punto de vista económico, y más otros no son necesarios, ya que las batallas se ganan rápidamente. En general, es evidente que hay una serie de componentes, y muy probablemente no una neurona, y diferentes modelos responsables de diferentes componentes. Y además los propios desarrolladores han declarado que utilizan diferentes modelos de estrategias básicas, por lo que habría algún tipo de aleatoriedad.
 

Hola a todos. Ya que hemos establecido que TODOS aquí son bastante inteligentes y esto no es un sarcasmo sino una afirmación de hecho. El campo de la medicina forense no carece de inteligencia, así que tengo una pregunta para la comunidad. ¿Alguien ha administrado alguna vez UBUNTU? Me refiero a la administración. El problema es este. Durante la optimización, este proceso se ejecuta tantas veces como núcleos tenga el sistema y se paraleliza.

Pregunta: ¿es posible obligar a 2 o 4 núcleos a servir a un proceso no divisible en ejecución? Bueno, eso es sólo para mí... tal vez alguien lo sepa...

 

Google está trabajando hoy

https://deepmind.com/blog/alphastar-mastering-real-time-strategy-game-starcraft-ii/

Bien, ayer me metí en una discusión inútil de nuevo

 
Maxim Dmitrievsky:

Google está trabajando hoy

https://deepmind.com/blog/alphastar-mastering-real-time-strategy-game-starcraft-ii/

OK, ayer me metí en una discusión inútil de nuevo

Obsérvese que en el gráfico de la expectativa del resultado de la batalla, aparece exactamente la probabilidad de la que hablaba, situacional, que activa la retroalimentación de las neuronas. Se puede ver claramente cómo esta probabilidad cambia a medida que ambos bandos exploran y pierden unidades, es decir, hay un recálculo constante del equilibrio de poder y de las propias expectativas. Está claro que no es una variante clásica de RL.


 
Aleksey Vyazmikin:

Obsérvese que en el gráfico de expectativas de la batalla, está exactamente la probabilidad de la que hablaba: la probabilidad situacional que activa la retroalimentación de la neurona. Se puede ver claramente cómo esta probabilidad cambia a medida que ambos bandos exploran y pierden unidades, es decir, hay un recálculo constante del equilibrio de poder y de las propias expectativas. Está claro que no es una variante clásica de RL.


Así que eres tan torpe que pensé que eso era lo que intentaba decirte :D

Lee sobre el equilibrio de Nash en el enlace también, yo describí el algoritmo 1 en 1 ayer, sin siquiera leer

la cuestión es que el juego no tiene una estimación de probabilidad y el juego tiene una EFICIENCIA :)) vuelve a leer tu post

Lo obvio es el clásico RL profundo LOL, deja de decir tonterías cuando no estás en el tema

 
Maxim Dmitrievsky:

Así que eres tan torpe que creí que eso era lo que intentaba explicarte :D

leer sobre el equilibrio de Nash en el enlace también, he descrito el algoritmo 1 en 1 ayer, sin siquiera leerlo

el juego no tiene probabilidades, el juego tiene una influencia sobre el oponente :)) - vuelve a leer tus mensajes

Lo único que se ve es un clásico RL profundo LOL, deja de decir tonterías cuando no estás en el tema.

Este es un foro para el comercio, los sistemas de comercio automatizado y la prueba de las estrategias de negociación

Traté de responder a todas mis preguntas sobre el aprendizaje automático en el comercio.

Aleksey Vyazmikin, 2019.01.25 17:15

Yo lo veo de forma ligeramente diferente, en el juguete hay convencionalmente una evaluación matemática de cada bando que consta de muchos factores -el número de bots y su potencial, los activos, el dinero, y el objetivo del oponente de disminuir esta cifra de evaluación para mantener su cifra de evaluación más alta que la del oponente, es decir, gastar menos energía en el resultado. Esto da lugar a un sistema de influencia mutua, en el que está claro que si al sacrificar una unidad se disminuye el valor estimado de los activos del adversario en mayor medida que el valor estimado de la unidad, entonces es la decisión correcta, y si no, entonces no es la correcta. Y en el trading no tenemos garantías, sólo probabilidad, pero en un juguete hay garantías matemáticas que se pueden calcular.

No podemos influir en la situación, pero en el juego sí, incluso creando nosotros mismos situaciones ventajosas.

Foro sobre comercio, sistemas de comercio automatizados y prueba de estrategias de comercio

Aprendizaje automático en el comercio: teoría y práctica (comercio y no sólo)

Aleksey Vyazmikin, 2019.01.26 00:06

Si tuviéramos un creador de bots, podríamos hacerle una serie de preguntas y nos sorprenderíamos mucho de las respuestas. Todos estos RL son buenos para aprender los factores de influencia estacionaria en el entorno, pero si estás jugando contra otro jugador, entonces el RL desnudo no funcionará aquí. No he estudiado esta área en profundidad, puede que me equivoque. Pero hay una clara interacción con el entorno cambiante, no se puede ver en el comportamiento de los bots que haya una expectativa de nada, no se puede ver en absoluto, hay un control de la probabilidad de causar daño tanto a ti como a tu oponente, y hay errores de cálculo simplemente y actuar hacia una menor probabilidad de un resultado negativo, pero eso no es la probabilidad dada por la política al comienzo del juego - es el efecto en el entorno cambiante.


No sé, quizás tu cerebro está acostumbrado a pensar con conceptos de los libros, pero a mí me resulta más fácil operar con asuntos menos elevados, así que lo describí con mis propias palabras.
Razón de la queja: