Discusión sobre el artículo "Añadimos un LLM personalizado a un robot comercial (Parte 5): Desarrollar y probar la estrategia de negociación con LLMs (I) Ajuste fino"

 

Artículo publicado Añadimos un LLM personalizado a un robot comercial (Parte 5): Desarrollar y probar la estrategia de negociación con LLMs (I) Ajuste fino:

Con el rápido desarrollo de la inteligencia artificial en la actualidad, los modelos lingüísticos (LLM) son una parte importante de la inteligencia artificial, por lo que deberíamos pensar en cómo integrar potentes LLM en nuestras operaciones algorítmicas. Para la mayoría de la gente, es difícil ajustar estos potentes modelos a sus necesidades, desplegarlos localmente y luego aplicarlos a la negociación algorítmica. Esta serie de artículos abordará paso a paso la consecución de este objetivo.

En nuestro artículo anterior, presentamos cómo usar la aceleración de GPU para entrenar modelos de lenguaje grandes, pero no la usamos para formular estrategias comerciales o realizar pruebas retrospectivas. Sin embargo, el objetivo final de entrenar nuestro modelo es usarlo y que nos sirva. Entonces, a partir de este artículo, utilizaremos paso a paso el modelo de lenguaje entrenado para formular estrategias comerciales y probar nuestras estrategias en pares de divisas extranjeras. Por supuesto, este no es un proceso sencillo. Requiere que adoptemos medios técnicos correspondientes para lograr este proceso. Así que vamos a implementarlo paso a paso. 

Todo el proceso puede requerir varios artículos para completarse.

  • El primer paso es formular una estrategia comercial. 
  • El segundo paso es crear un conjunto de datos según la estrategia y ajustar el modelo (o entrenar el modelo), de modo que las entradas y la salidas del modelo se ajusten a nuestra estrategia comercial. Hay muchos métodos diferentes para lograr este proceso, y proporcionaré tantos ejemplos como sea posible.
  • El tercer paso es la inferencia del modelo y la fusión de las salidas con la estrategia comercial y crear un EA de acuerdo con nuestra estrategia comercial. Por supuesto, todavía tenemos trabajo que hacer en la fase de inferencia del modelo (elegir el marco de inferencia y los métodos de optimización adecuados: por ejemplo, atención instantánea, cuantificación del modelo, aceleración, etc.). 
  • El cuarto paso es utilizar backtesting histórico para probar nuestro EA en el lado del cliente.

Autor: Yuqiang Pan

 
Hola
¿Cuál es la principal diferencia entre el proceso de formación y el proceso de ajuste cuando se trabaja con modelos lingüísticos?
 
Christian Benjamin #:
Hola
¿Cuál es la principal diferencia entre el proceso de formación y el proceso de ajuste cuando se trabaja con modelos lingüísticos?

Hola, a partir de los ejemplos de este artículo:

1. Los pesos del modelo GPT2 preentrenado que utilizamos en este ejemplo no tienen ningún contenido relacionado con nuestros datos, y las series temporales de entrada no se reconocerán sin un ajuste fino, pero el contenido correcto puede salir de acuerdo con nuestras necesidades después del ajuste fino.

2. Como decíamos en nuestro artículo, lleva mucho tiempo entrenar un modelo lingüístico desde cero para hacerlo converger, pero el ajuste fino hará que un modelo preentrenado converja rápidamente, ahorrando mucho tiempo y potencia de cálculo. Como el modelo utilizado en nuestro ejemplo es relativamente pequeño, este proceso no es muy obvio.

3. Si la cantidad de datos no es suficiente, afinar el modelo con la misma cantidad de datos es mucho mejor que entrenar directamente un modelo.

 

Hola, gracias por los increíbles artículos.


Estoy deseando ver cómo vamos a integrar el modelo afinado en MT5