Matrices y vectores en MQL5: funciones de activación

MetaTrader 5 — Ejemplos | 23 agosto 2023, 10:20

1 100

MetaQuotes

Introducción

Ya se han publicado muchos libros y artículos sobre el tema del entrenamiento de redes neuronales, y en nuestro recurso MQL5.com, los miembros de la comunidad también han publicado multitud de materiales, incluidas varias series de artículos.

En esta publicación, describiremos solo uno de los aspectos del aprendizaje automático: las funciones de activación. Hoy le mostraremos lo que hay "debajo del capó".

Una breve panorámica

En las redes neuronales artificiales, las funciones de activación de neuronas calculan el valor de la señal de salida en función de los valores de una señal de entrada o un conjunto de señales de entrada. La función de activación debe ser diferenciable en todo el conjunto de valores. Esta condición posibilita la propagación inversa del error al entrenar redes neuronales. Para propagar el error de forma inversa, deberemos calcular el gradiente de la función de activación: el vector de derivadas parciales de la función de activación para cada valor del vector de señal de entrada. Se cree que las funciones de activación no lineales son mejores en el aprendizaje, aunque la función ReLU completamente lineal ha demostrado su eficacia en muchos modelos.

Ilustraciones

Como ilustraciones, hemos preparado gráficos de la función de activación y sus derivados en una secuencia monótonamente creciente de -5 a 5. Hemos preparado un script que muestra el gráfico de la función en el gráfico de precios. Al presionar la tecla Page Down, se mostrará un cuadro de diálogo de apertura de archivo para especificar el nombre de la imagen a guardar.

Guardando un archivo png

La tecla ESC finaliza el script. No ofrecemos el texto de este script aquí, lo encontrará adjunto al artículo. Un script similar fue escrito por el autor del artículo Redes neuronales de propagación inversa del error en matrices MQL5; tomamos la idea de él para mostrar, junto con el gráfico de la función de activación, un gráfico con los valores de las derivadas de la función de activación correspondiente.

Script de demostración con todas las funciones de activación

La gráfica de la función de activación se traza con una línea azul; la gráfica de las derivadas de la función se traza en rojo.

Función de activación Exponential Linear Unit (ELU)

Evaluación de la función

   if(x >= 0)
      f = x;
   else
      f = alpha*(exp(x) - 1);

Cálculo de la derivada

   if(x >= 0)
      d = 1;
   else
      d = alpha*exp(x);

Esta función presupone un parámetro adicional alpha. Si no se indica, su valor predeterminado será 1.

   vector_a.Activation(vector_c,AF_ELU);      // call with the default parameter

Función de activación ELU

   vector_a.Activation(vector_c,AF_ELU,3.0);  // call with alpha=3.0

Función de activación ELU con el parámetro alpha=3.0

Función de activación Exponential

Evaluación de la función

   f = exp(x);

La derivada de la función exp es la propia función exp.

Como podemos ver en la fórmula de cálculo, la función de activación Exponential no tiene parámetros adicionales

vector_a.Activation(vector_c,AF_EXP);

Función de activación Exponential

Función de activación Gaussian Error Linear Unit (GELU)

Evaluación de la función

   f = 0.5*x*(1 + tanh(sqrt(M_2_PI)*(x+0.044715*pow(x,3)));

Cálculo de la derivada

   double x_3 = pow(x,3);
   double tmp = cosh(0.0356074*x + 0.797885*x);
   d = 0.5*tanh(0.0356774*x_3 + 0.398942*x)+(0.535161*x_3 + 0.398942*x)/(tmp*tmp) + 0.5;

No hay parámetros adicionales.

vector_a.Activation(vector_c,AF_GELU);

Función de activación GELU

Función de activación Hard Sigmoid

Evaluación de la función

   if(x < -2.5)
      f = 0;
   else
     {
      if(x > 2.5)
         f = 1;
      else
         f = 0.2*x + 0.5;
     }

Cálculo de la derivada

   if(x < -2.5)
      d = 0;
   else
     {
      if(x > 2.5)
         d = 0;
      else
         d = 0.2;
     }

No hay parámetros adicionales.

vector_a.Activation(vector_c,AF_HARD_SIGMOID);

Función de activación Hard Sigmoid

Función de activación Linear

Evaluación de la función

   f = alpha*x + beta

Cálculo de la derivada

   d = alpha

Parámetros adicionales alpha = 1,0 y beta = 0,0

vector_a.Activation(vector_c,AF_LINEAR);         // call with default parameters

Función de activación Linear

vector_a.Activation(vector_c,AF_LINEAR,2.0,5.0);  // call with alpha=2.0 and beta=5.0

Función de activación Linear, alfa=2, beta=5

Función de activación Leaky Rectified Linear Unit (LReLU)

Evaluación de la función

   if(x >= 0)
      f = x;
   else
      f = alpha * x;

Cálculo de la derivada

   if(x >= 0)
      d = 1;
   else
      d = alpha;

Esta función presupone un parámetro adicional alpha. Si no se indica, su valor predeterminado será 0. 3

   vector_a.Activation(vector_c,AF_LRELU);      // call with the default parameter

Función de activación LReLU

vector_a.Activation(vector_c,AF_LRELU,0.1);  // call with alpha=0.1

Función de activación LReLU con el parámetro alpha=0.1

Función de activación Rectified Linear Unit (ReLU)

Evaluación de la función

   if(alpha==0)
     {
      if(x > 0)
         f = x;
      else
         f = 0;
     }
   else
     {
      if(x >= max_value)
         f = x;
      else
         f = alpha * (x - treshold);
     }

Cálculo de la derivada

   if(alpha==0)
     {
      if(x > 0)
         d = 1;
      else
         d = 0;
     }
   else
     {
      if(x >= max_value)
         d = 1;
      else
         d = alpha;
     }

Parámetros adicionales alfa=0, max_value=0 y umbral=0.

vector_a.Activation(vector_c,AF_RELU);         // call with default parameters

Función de activación ReLU

vector_a.Activation(vector_c,AF_RELU,2.0,0.5);      // call with alpha=2.0 and max_value=0.5

vector_a.Activation(vector_c,AF_RELU,2.0,0.5,1.0);  // call with alpha=2.0, max_value=0.5 and treshold=1.0

Función de activación ReLU, alfa=2, valor_máximo=0,5, umbral=1

Función de activación Scaled Exponential Linear Unit (SELU)

Evaluación de la función

   if(x >= 0)
      f = scale * x;
   else
      f = scale * alpha * (exp(x) - 1);

where scale = 1.05070098, alpha = 1.67326324

Cálculo de la derivada

   if(x >= 0)
      d = scale;
   else
      d = scale * alpha * exp(x);

No hay parámetros adicionales.

vector_a.Activation(vector_c,AF_SELU);

Función de activación SELU

Función de activación Sigmoid

Evaluación de la función

   f = 1 / (1 + exp(-x));

Cálculo de la derivada

   d = exp(x) / pow(exp(x) + 1, 2);

No hay parámetros adicionales.

vector_a.Activation(vector_c,AF_SIGMOID);

Función de activación Sigmoid

Función de activación Softplus

Evaluación de la función

   f = log(exp(x) + 1);

Cálculo de la derivada

   d = exp(x) / (exp(x) + 1);

No hay parámetros adicionales.

vector_a.Activation(vector_c,AF_SOFTPLUS);

Función de activación Softplus

Función de activación Softsign

Evaluación de la función

   f = x / (|x| + 1)

Cálculo de la derivada

   d = 1 / (|x| + 1)^2

No hay parámetros adicionales.

vector_a.Activation(vector_c,AF_SOFTSIGN);

Función de activación de Softsign

Función de activación Swish

Evaluación de la función

   f = x / (1 + exp(-x*beta));

Cálculo de la derivada

   double tmp = exp(beta*x);
   d = tmp*(beta*x + tmp + 1) / pow(tmp+1, 2);

Parámetro adicional beta = 1

vector_a.Activation(vector_c,AF_SWISH);         // call with the default parameter

Función de activación Swish

vector_a.Activation(vector_c,AF_SWISH,2.0);     // call with beta = 2.0

Función de activación Swish, beta=2

vector_a.Activation(vector_c,AF_SWISH,0.5);   // call with beta=0.5

Función de activación Swish, beta=0.5

Función de activación Hyperbolic Tangent (TanH)

Evaluación de la función

   f = tanh(x);

Cálculo de la derivada

   d = 1 / pow(cosh(x),2);

No hay parámetros adicionales.

vector_a.Activation(vector_c,AF_TANH);

Función de activación TanH

Función de activación Thresholded Rectifiedl Linear Unit (TReLU)

Evaluación de la función

   if(x > theta)
      f = x;
   else
      f = 0;

Cálculo de la derivada

   if(x > theta)
      d = 1;
   else
      d = 0;

Parámetro adicional theta = 1

vector_a.Activation(vector_c,AF_TRELU);         // call with default parameter

Función de activación TReLU

vector_a.Activation(vector_c,AF_TRELU,0.0);     // call with theta = 0.0

Función de activación TReLU, theta=0

vector_a.Activation(vector_c,AF_TRELU,2.0);      // call with theta = 2.0

Función de activación TReLU, theta=2

Función de activación Parametric Rectifiedl Linear Unit (PReLU)

Evaluación de la función

   if(x[i] >= 0)
      f[i] = x[i];
   else
      f[i] = alpha[i]*x[i];

Cálculo de la derivada

   if(x[i] >= 0)
      d[i] = 1;
   else
      d[i] = alpha[i];

El parámetro adicional es el vector de coeficientes alpha.

vector alpha=vector::Full(vector_a.Size(),0.1);
vector_a.Activation(vector_c,AF_PRELU,alpha);

Función de activación PReLU

Función especial Softmax

El resultado del cálculo de la función de activación Softmax depende no solo de un valor específico, sino también de todos los valores del vector.

   sum_exp = Sum(exp(vector_a))
   f = exp(x) / sum_exp

Cálculo de la derivada

   d = f*(1 - f)

Por consiguiente, la suma de todos los valores del vector activado será 1. Por eso, la función de activación de Softmax se utiliza muy a menudo para la última capa de modelos de clasificación.

Gráfico de la función de activación del vector con valores de -5 a 5

Función de activación Softmax

Gráfico de la función de activación del vector con valores de -1 a 1

Función de activación Softmax

Si no hay función de activación (AF_NONE)

Si no hay una función de activación, los valores del vector de entrada se transmitirán al vector de salida sin ninguna transformación. En la práctica, esta es una función de activación lineal con parámetros alpha = 1 y beta = 0.

Conclusión

Como conclusión, le sugerimos que se familiarice con los textos originales de las funciones de activación y sus derivadas que se encuentran en el archivo adjunto ActivationFunction.mqh.

Traducción del ruso hecha por MetaQuotes Ltd.
Artículo original: https://www.mql5.com/ru/articles/12627

Archivos adjuntos |

Descargar ZIP

PlotActivationFunction.mq5 (4.44 KB)

ActivationFunction.mqh (7.2 KB)

Advertencia: todos los derechos de estos materiales pertenecen a MetaQuotes Ltd. Queda totalmente prohibido el copiado total o parcial.

Otros artículos del autor

Últimos comentarios | Pasar a la discusión en el foro de los operadores (2)

Renat Akhtyamov | 2 jun 2023 en 05:29

genial

¡gracias por el artículo!

Lorentzos Roussos | 23 jun 2023 en 15:27

Guión práctico , gracias .

He horneado algunos también :

ReLu + Sigmoid + Shift para capturar de 0.0 a 1.0 salida (entrada -12 a 12)

double activationSigmoid(double x){
return(1/(1+MathExp(-1.0*x)));
}
double derivativeSigmoid(double activation_value){
return(activation_value*(1-activation_value));
}
double activationReLuShiSig(double x,double shift=-6.0){
if(x>0.0){
  return(activationSigmoid(x+shift));
  }
return(0.0);
}
double derivativeReLuShiSig(double output){
if(output>0.0){
  return(derivativeSigmoid(output));
  }
return(0.0);
}

exponencial limitada .af=f' (entrada -5.0 a 5.0)

double activationLimitedExponential(double x){
return(MathExp(x)/149.00);
}

//y la derivada es ella misma
double derivativeLimitedExponential(double x){
return(x);
}

👨‍🔧

Teoría de categorías en MQL5 (Parte 8): Monoides

El presente artículo continúa la serie sobre la implementación de la teoría de categorías en MQL5. Aquí presentamos los monoides como un dominio (conjunto) que distingue la teoría de categorías de otros métodos de clasificación de datos al incluir reglas y un elemento de identidad.

Envolviendo modelos ONNX en clases

La programación orientada a objetos permite crear un código más compacto, fácil de leer y modificar. Le presentamos un ejemplo para tres modelos ONNX.

Redes neuronales: así de sencillo (Parte 38): Exploración auto-supervisada por desacuerdo (Self-Supervised Exploration via Disagreement)

Uno de los principales retos del aprendizaje por refuerzo es la exploración del entorno. Con anterioridad, hemos aprendido un método de exploración basado en la curiosidad interior. Hoy queremos examinar otro algoritmo: la exploración mediante el desacuerdo.

Trading bursátil con cuadrícula usando un asesor con órdenes stop pendientes en la Bolsa de Moscú (MOEX)

Hoy utilizaremos un enfoque comercial de cuadrícula con órdenes stop pendientes en un asesor experto en el lenguaje de estrategias comerciales MQL5 para MetaTrader 5 en la Bolsa de Moscú (MOEX). Al comerciar en el mercado, una de las estrategias más simples consiste en colocar una cuadrícula de órdenes diseñada para "atrapar" el precio del mercado.

Introducción

Una breve panorámica

Ilustraciones

Función de activación Exponential Linear Unit (ELU)

Función de activación Exponential

Función de activación Gaussian Error Linear Unit (GELU)

Función de activación Hard Sigmoid

Función de activación Linear

Función de activación Leaky Rectified Linear Unit (LReLU)

Función de activación Rectified Linear Unit (ReLU)

vector_a.Activation(vector_c,AF_RELU,2.0,0.5,1.0); // call with alpha=2.0, max_value=0.5 and treshold=1.0

Función de activación Scaled Exponential Linear Unit (SELU)

Función de activación Sigmoid

Función de activación Softplus

Función de activación Softsign

Función de activación Swish

Función de activación Hyperbolic Tangent (TanH)

Función de activación Thresholded Rectifiedl Linear Unit (TReLU)

Función de activación Parametric Rectifiedl Linear Unit (PReLU)

Función especial Softmax

Si no hay función de activación (AF_NONE)

Conclusión

Otros artículos del autor