Discusión sobre el artículo "Características del Wizard MQL5 que debe conocer (Parte 62): Uso de patrones del ADX y el CCI con aprendizaje por refuerzo TRPO"

 

Artículo publicado Características del Wizard MQL5 que debe conocer (Parte 62): Uso de patrones del ADX y el CCI con aprendizaje por refuerzo TRPO:

El oscilador ADX y el oscilador CCI son indicadores de seguimiento de tendencias y de impulso que pueden combinarse al desarrollar un asesor experto. Retomamos donde lo dejamos en el artículo anterior y analizamos cómo es posible llevar a cabo el entrenamiento en condiciones reales y la actualización del modelo que hemos desarrollado gracias al aprendizaje por refuerzo. Estamos utilizando un algoritmo que aún no hemos tratado en esta serie, conocido como «optimización de políticas de región de confianza» (Trusted Region Policy Optimization, TRPO). Y, como siempre, la creación de asesores expertos mediante el Asistente de MQL5 (Wizard MQL5) nos permite configurar nuestros modelos para su prueba de forma mucho más rápida y, además, de manera que puedan distribuirse y probarse con diferentes tipos de señales.

Antes, para que un programa informático proporcionara una respuesta útil o práctica, esta respuesta debía introducirse manualmente en el programa mediante código. Básicamente, la cláusula if era fundamental para programar la mayoría de los programas. Y si lo piensas bien, la dependencia de las cláusulas if implicaba que los datos introducidos por el usuario o los datos procesados por el programa tenían que pertenecer a ciertas categorías. Tenía que ser discreto. Por lo tanto, se puede argumentar, en su mayor parte, que nuestro desarrollo y uso de datos discretos fue una respuesta a las limitaciones de programación y no fue pertinente a los datos o al problema que se estaba resolviendo.

Y entonces llegó OpenAI en otoño de 2023 con su primer GPT público, y todo cambió. El desarrollo de las redes de transformadores y los GPT no se produjo de la noche a la mañana, ya que los primeros perceptrones se desarrollaron a finales de los años 60, pero se puede afirmar con seguridad que el lanzamiento de ChatGPT fue un hito importante. Con la amplia adopción de modelos de lenguaje a gran escala, ha quedado muy claro que la tokenización, la incrustación de palabras y, por supuesto, la autoatención son componentes críticos para permitir que los modelos escalen en función de lo que pueden procesar. No más cláusulas condicionales. Es teniendo en cuenta este contexto de uso de tokenización e incrustación de palabras para lograr que las entradas de la red sean lo más continuas posible, que también hicimos que las entradas de nuestra MLP de aprendizaje supervisado fueran "más continuas".

Características del Wizard MQL5 que debe conocer (Parte 62)


Autor: Stephen Njuki