English Русский 中文 Deutsch 日本語 Português 한국어 Français Italiano Türkçe
Analizando los parámetros estadísticos de los indicadores

Analizando los parámetros estadísticos de los indicadores

MetaTrader 5Estadística y análisis | 12 marzo 2014, 14:15
6 610 0
СанСаныч Фоменко
СанСаныч Фоменко

Introducción

Los operadores utilizan ampliamente los indicadores mostrando las cotizaciones básicas "más claramente" permitiendo realizar el análisis y la predicción del movimiento de precios del mercado. Los problemas relativos a la validez de la transformación y la credibilidad de los resultados obtenidos no son normalmente considerados y, en el mejor de los casos, se sustituyen con la prueba de los sistemas de trading basada en los indicadores.

Es bastante obvio que no tiene sentido usar los indicadores y mucho menos aplicarlos a la creación de sistemas de trading, a menos que podamos resolver los problemas relativos a la transformación de las cotizaciones iniciales y la credibilidad del resultado obtenido. En este artículo mostramos que hay serias razones para dicha conclusión. Vamos a considerar los problemas potenciales de usar tres indicadores: línea de tendencia recta, media móvil exponencial y filtro Hodrick-Prescott.


1. Un poco de teoría

Para comodidad de los lectores mencionaré algunos términos de la teoría de probabilidad y la estadística matemática que se utilizarán posteriormente. Proporcionaré enlaces ya que los términos aplicados aquí son completamente equivalentes a los usados en los libros de texto.

1.1. La descripción probabilística de las observaciones económicas

Las cotizaciones que observamos son medidas selectivas indirectas (la población general es desconocida para nosotros) de algunos procesos estocásticos a nivel fundamental incluyendo:

  • componentes determinísticos medidos con precisión, por ejemplo, transacciones de compra o de venta de divisas ejecutadas;
  • componentes determinísticos medidos con un error, como la cantidad de divisas vendida en un intervalo de tiempo, por ejemplo, en un día;
  • componente estocástico, que no puede medirse, como el estado de ánimo de un grupo de gente. Durante la mayor parte del tiempo, la característica principal de este componente es un movimiento aleatorio con una tendencia.

La interacción de estos componentes da como resultado un proceso estocástico incluyendo:

  • tendencias (deterministas y estocásticas);
  • ciclos con periodos de longitud fija y estocástica;
  • movimiento aleatorio con una tendencia.

La no estacionariedad es una característica común de los procesos estocásticos que se refleja en las cotizaciones de divisas. El concepto de proceso estocástico no estacionario es importante para nosotros solo porque casi no proporciona medios para su análisis, por lo que debe dividirse en un conjunto de procesos separados que permitan su análisis. Al aplicar los indicadores, un operador no piensa en la aplicabilidad del indicador sobre una cotización de símbolo concreta. Sin embargo, hay herramientas econométricas que permiten evaluar la posibilidad de aplicar un indicador y el resultado de esta aplicación.


1.2. Evento aleatorio. Probabilidad

Un evento aleatorio (comprar y vender divisas en nuestro caso) es un evento que puede ocurrir o no. Sabemos que el número de transacciones en días diferentes y en horas distintas del día es diferente y, de hecho, es un valor aleatorio pero solo los eventos en puntos discretos del tiempo (como los minutos, horas, días, etc.) se tienen en cuenta normalmente.

La frecuencia relativa de un suceso aleatorio es el ratio de un número de veces que ocurre dicho evento M respecto al número general de observaciones realizadas N. Con el crecimiento del número de observaciones (en teoría hasta el infinito) la frecuencia tiende al número llamado probabilidad de evento aleatorio. De acuerdo con la definición, la probabilidad es un valor desde cero hasta uno. El término "probabilidad" se usará normalmente en este artículo en lugar de frecuencia relativa.

El valor aleatorio es una cantidad que toma diferentes valores con ciertas probabilidades.

El conjunto general se refiere a todos los posibles valores que puede tomar el valor aleatorio. Siempre trabajamos con una muestra del conjunto general en el mercado, normalmente usando las cotizaciones para un periodo de tiempo. Es muy normal que las estadísticas obtenidas usando una muestra difieran de las estadísticas calculadas sobre el conjunto general, ya que la frecuencia relativa es distinta de la probabilidad. Se han realizado cálculos posteriores para evaluar las diferencias entre las estadísticas obtenidas usando una muestra y las obtenidas sobre el conjunto general. Dicho enfoque es imposible en el caso de indicadores, ya que en los precios, por ejemplo, un precio cerrado es considerado un valor determinístico por un indicador durante los cálculos.

Otra interesante observación. Como intentamos observar el conjunto general, podemos ignorar las diferencias en las cotizaciones enviadas por diferentes centros de transacciones, ya que es fácil cambiar los valores de las cotizaciones pero es muy difícil cambiar sus propiedades estadísticas.


1.3. Características de las variables aleatorias

1.3.1. Estadística descriptiva

El conjunto de cantidades aleatorias (cotizaciones de moneda en nuestro caso) se caracteriza por un cierto número de parámetros. Algunos de estos parámetros se usarán más tarde.

Un histograma es un gráfico que muestra la frecuencia del valor aleatorio. En un caso extremo es un gráfico que muestra la densidad de la distribución de probabilidad.

La media aritmética (promedio) es la suma de todos los valores de las observaciones dividida por el número de observaciones (el número de periodos en nuestro caso). No es aplicable a todas las distribuciones y son las más comunes cuando coinciden con la media. Estrictamente hablando, esto implica que el indicador de media móvil más común puede aplicarse en caso de que las cotizaciones tengan una ley de distribución para las que exista el valor medio.

La mediana divide todas las observaciones en un muestra en dos partes: en el primer caso todas las observaciones son menores que el valor de la mediana y en el segundo los valores de las observaciones superan al valor de la mediana. La mediana existe para cualquier distribución y no es sensible a los valores atípicos. El hecho de que la media sea igual (o cercana) a la mediana es una de las características de la ley de distribución normal.

La desviación de la media es una cuestión muy interesante. La varianza es un valor medio de los cuadrados de la desviación del valor aleatorio de su esperanza matemática. La raíz cuadrada de la varianza es una desviación cuadrática (estándar) media.

La desviación estándar y la varianza no son resistentes a los valores atípicos.

Una cantidad adimensional llamada ratio asimétrico (asimetría) sirve como indicador de un grado de asimetría de la curva de densidad de distribución. Si el valor de la asimetría es menor que "seis dividido por el número de observaciones", la distribución de probabilidad de un valor aleatorio cumple la ley normal.

Otro valor que caracteriza la densidad de distribución es el coeficiente de kurtosis. Es igual a 3 en condiciones normales. En caso de que la kurtosis sea mayor a 3, la cresta es muy picuda y acusada y las colas caen en un ángulo muy pequeño.

Como podemos ver, hay muchos conceptos aplicables a las variables aleatorias sujetas a una ley de distribución normal. Esto no es tan malo, ya que un gran número de leyes de distribución se reducen a la distribución normal cuando se incrementa el número de observaciones.

1.3.2. Distribución normal

La distribución normal (gausiana) es un caso extremo de casi todas las distribuciones de probabilidad reales.

El teorema del límite de Lyupanov sirve como base teórica según la cual la distribución de las sumas de los valores aleatorios independientes que tengan cualquier distribución inicial serán normales en caso de que haya muchas observaciones y su contribución sea pequeña. Por tanto, es de amplio uso en muchas aplicaciones del mundo real de la teoría de probabilidad.

La distribución normal es una curva de campana simétrica que se extiende a lo largo de todo el eje x. La distribución gausiana depende de dos parámetros: μ (esperanza matemática) y σ (desviación estándar).

La esperanza matemática y la mediana de una distribución dada son iguales a μ, mientras que la varianza es igual a σ2. La curva de densidad de probabilidad es simétrica respecto a la esperanza matemática. El ratio de asimetría y el exceso son γ = 0, ε = 3.

La densidad de distribución normal se describe a menudo no como una función de variable x sino como una función de variable z = (x − μ) / σ con esperanza matemática cero y una varianza igual a 1.

La distribución con μ = 0 and σ = 1 se llama distribución normal estándar (i.i.i).

Fig. 1. Distribución normal

Fig. 1. Distribución normal

1.3.3. Distribución de Student (distribución t)

El principal parámetro es el grado de libertad (el número de elementos en la muestra). Con el aumento del número de grados de libertad, la distribución de Student se aproxima a la normal estandarizada, y en caso de que n > 30, la distribución de Student puede reemplazarse por una distribución norma. Si n <30 la distribución de Student tendrá colas más grandes.

Fig. 2. Distribución de Student

Fig. 2. Distribución de Student

El estadístico t es ampliamente usado en las hipótesis estadísticas de prueba.

1.3.4. Chi-cuadrado (distribución de Pearson)

En caso de que Xi sean valores aleatorios independientes con i.i.i., entonces la suma de sus cuadrados se ajusta a una distribución χ2. La densidad depende de un solo parámetro v (normalmente llamado el número de grados de libertad) igual al número de variables aleatorias independientes. Si el número de grados de libertad ν →∞, χ2 la distribución tiende a una distribución normal con centro v y varianza 2v. La densidad de distribución es asimétrica, unimodal y también se hace más plana y simétrica con el aumento del número de grados de libertad.

Fig. 3. Distribución de Pearson (chi-cuadrado)

Fig. 3. Distribución de Pearson (chi-cuadrado)

1.3.5. Distribución F de Fisher

La distribución F de Fisher es una distribución de una relación de varianza, es decir, la relación entre dos series de dispersiones.

Si dos variables aleatorias independientes tienen una distribución chi-cuadrado con grados de libertad (V1, V2), su ratio tiene una distribución de Fisher.

Fig. 4. Distribución de Fisher

Fig. 4. Distribución de Fisher


1.3.6. Relación de cálculo de la R-cuadrado

La relación de cálculo muestra qué porcentaje de la varianza resultante es explicada por las variables independientes. En el caso de dos variables es el cuadrado de la correlación de Pearson. Muestra la varianza total entre las dos variables.

La importancia de la relación de correlación depende del número de observaciones para el estadístico F de Fisher. Cuando el número de velas en una cotización excede de 100, incluso cada pequeña desviación de los valores observados a partir de cero es suficiente para confirmar la importancia del indicador.

1.4. Hipótesis determinante

¿Qué conclusiones podemos sacar de un conjunto de parámetros determinado si tenemos un valor de su parámetro? La respuesta a esta pregunta depende de si tenemos alguna información previa sobre el tamaño del parámetro general.

Si la información previa sobre la magnitud general del parámetro no existe, podemos evaluar este parámetro por un valor discriminante, estableciendo el intervalo de confianza para el mismo, es decir, el rango dentro del cual se encuentra su valor con una cierta probabilidad.

En la práctica necesitamos normalmente verificar algunos específicos y en la mayoría de casos la hipótesis simple de excepción. Esta hipótesis se considera la hipótesis nula. Para poner a prueba la hipótesis se usan algunos criterios que permiten aceptarla o rechazarla. Los estadísticos que se muestran más abajo son los más usados como criterio, estadístico t, F de Fisher y chi-cuadrado. Al usar un software de estadística (por ejemplo Statistica) o de econometría (como Eviews), el criterio viene acompañado de un valor significativo para el mismo, el palor p. Por ejemplo, el valor p de 0,02 (2%) significa que el criterio correspondiente no es significativo al 1% de nivel de significación y significativo al nivel de significación 5%. Por equivalencia, puede asumirse que la hipótesis nula no es válida con la probabilidad igual a "1 - el valor p".

La elección de un valor p es subjetiva y se determinada por la importancia de las consecuencias de una evaluación errónea de un criterio específico.


1.5. Características estadísticas de las cotizaciones

1.5.1. Estadística descriptiva

La estadística descriptiva incluye:

  • Un histograma que debe aproximarse a una ley de distribución cuando se incrementa el número de velas en una cotización;
  • Principales medidas de tendencia: media y mediana;
  • Medida de la varianza: desviación estándar;
  • Medidas de forma: asimetría y kurtosis;
  • Criterio de normalidad de Jarque-Bera.

Criterio de normalidad de Jarque-Bera. Hipótesis nula excepción. La distribución normal. Por ejemplo, la probabilidad del valor del criterio es igual a 0,04. Parece que puede sacarse la siguiente conclusión: la probabilidad de aceptar la hipótesis nula es igual a 4%. Sin embargo, esto no es del todo correcto ya que el valor calculado es un criterio del valor p y la probabilidad de aceptar la hipótesis nula es igual al 96%.


1.5.2. Autocorrelación y estadísticos Q

La correlación es una medida de la relación entre las dos variables. El ratio de correlación puede variar entre -1 y +1. El valor de -1 significa una correlación completamente negativa y el valor +1 significa una correlación completamente positiva. El valor 0 significa una ausencia de correlación.

La correlación entre los elementos de una cotización se llama autocorrelación. Puede ser muy útil al buscar tendencias. La presencia de autocorrelación pone a prueba cualquier conclusión sobre las cotizaciones, como variables aleatorias, ya que el factor más significativo a la hora de determinar un valor aleatorio es la independencia de varios precios en diferentes periodos de tiempo.

En el análisis estadístico, la autocorrelación del software suele ir acompañada de estadísticos Q de Ljung-Box con el valor p. La hipótesis nula es: no existe autocorrelación, es decir, en caso de que el valor p sea igual a cero podemos concluir que no existe autocorrelación respecto a algunas velas en una cotización.

La exclusión de autocorrelación (tendencias) de la cotizaciones es el primer paso para tener la posibilidad de usar métodos estadísticos matemáticos.


1.5.3. Estacionariedad de las cotizaciones

Vamos a suponer que las cotizaciones son estacionarias en caso de que su esperanza matemática y varianza no dependan del tiempo. Incluso esta definición de estacionariedad es demasiada estricta y no muy adecuada para su aplicación práctica. Las cotizaciones son muy a menudo consideradas estacionarias en caso de desviaciones en que la esperanza matemática y/o la varianza comprenda varios puntos porcentuales (normalmente no más de un 5%) en un cierto tiempo.

Las cotizaciones actuales en el mercado Forex no son estacionarias. Tienen las siguientes desviaciones:

  • La presencia de una tendencia generada por la dependencia entre observaciones en el tiempo. La dependencia es una característica típica de las cotizaciones de divisas y de las observaciones económicas en general;
  • Comportamiento cíclico;
  • Varianza no constante (heteroscedasticidad).

Las cotizaciones que se desvían de las estacionarias se llaman no estacionarias. Se analizan mediante la descomposición sucesiva en componentes. El proceso de descomposición termina con la recepción del total de series estacionarias con esperanza y/o varianza casi constante.

Hay varias pruebas para la estacionariedad de las cotizaciones. Las básicas son las pruebas de raíz unitaria. La más famosa de las pruebas de raíz unitaria es la prueba de Dickey-Fuller. Las cotizaciones de la hipótesis nula son no estacionarias (tienen una raíz unitaria), es decir, la media y la varianza dependen del tiempo. Como hay casi una dependencia constante en el tiempo (una tendencia) la presencia de una tendencia en las cotizaciones debe indicarse al hacer la prueba. En esta etapa se determinan a ojo.


1.6.  Especificación de los indicadores (regresión)

Un vistazo superficial a las pruebas de los indicadores escritos usando lenguajes como MQL5, por ejemplo, permite identificar dos formas de configuración: analítica (la más común) y tabular (aplicada a los indicadores, llamados filtros, por ejemplo, los indicadores de Kravchuk).

Pero usaremos el término "regresión", un término habitual en estadística y econometría.

Teniendo una idea de lo que queremos conseguir a partir de las cotizaciones, necesitamos establecer los siguientes parámetros para formular la regresión (del indicador):

  • La lista de variables independientes utilizadas para el cálculo de indicador;
  • Los ratios de las variables independientes;
  • Ecuación de cálculo del indicador que será usada para el cálculo de la variable dependiente.

Aunque pueden encontrarse algunas dificultades al crear indicadores multidivisa, estas no aparecen en una regresión.

Teniendo estas tres opciones, será necesario adaptar la regresión a una cotización. Al contrario de lo que ocurre en los foros, la palabra "adaptar, adaptación" no es algo extraño en econometría sino el procedimiento estándar durante el cual la conformidad de la regresión (del indicador) a las cotizaciones se calcula usando uno de los múltiples métodos de evaluación. El método de mínimos cuadrados ordinarios (MCO) es el más conocido.

La evaluación muestra dos puntos de interés:

  • Conformidad del indicador con las cotizaciones, el valor del error restante;
  • Estabilidad de los parámetros de la regresión calculados en el futuro.

Las respuestas a estas preguntas se dan durante el diagnóstico de los indicadores.


1.7. Diagnóstico de los indicadores

El diagnóstico de los indicadores se divide en tres grupos:

  • Diagnósticos de ratios;
  • Diagnósticos de residuos;
  • Diagnósticos de estabilidad;

Cada procedimiento de verificación descrito a continuación incluye la especificación de la hipótesis nula usada como hipótesis de verificación. El resultado de la verificación consiste en seleccionar los valores de uno o más estadísticos y sus valores p. Lo anterior indica la probabilidad de la ejecución de la condición de hipótesis nula que es la base de las estadísticas de verificación.

Por tanto, los valores p pequeños llevan a rechazar la hipótesis nula. Por ejemplo, si un valor p se sitúa entre 0,05 y 0,01, la hipótesis nula se desvía un 5% no un 1%.

Debe señalarse que hay varias sugerencias y resultados de distribución relacionados con cada verificación. Por ejemplo, algunos estadísticos son distribuciones precisas de pruebas finitas (normalmente distribuciones t o F). Otras son muestras grandes de estadísticos de prueba con distribuciones asintóticas χ2.


1.7.1. Diagnósticos de ratios

El diagnóstico de ratios proporciona información y define las limitaciones de los ratios evaluados incluyendo el caso especial de las verificaciones de variables omitidas y redundantes. Se usarán las siguientes verificaciones de los ratios de la ecuación de regresión:

  • Las elipses de confianza permiten mostrar la correlación entre los ratos de las ecuaciones;
  • La prueba de variables omitidas permite determinar la necesidad de variables adicionales en la ecuación de regresión;
  • Las pruebas de variables redundantes permiten mostrar las variables excesivas;
  • La prueba de ruptura permite determinar la reacción de la ecuación de regresión a los cambios de una tendencia. Es deseable crear una ecuación de regresión que sea igual de buena a la hora de reflejar las cotizaciones en segmentos ascendentes, descendentes y planos.


1.7.2. Diagnósticos de residuos

Ya hemos mencionado la importancia de estudiar los residuos al tratar de transformar las cotizaciones no estacionarias en estacionarias.

La prueba de raíces unitarias muestra que los residuos se distribuyen mucho más cerca de la ley normal en comparación con las cotizaciones básicas. La expresión "más cerca" refleja el hecho de que los residuos tienen la media y la varianza dependientes del tiempo, lo que provoca inestabilidad de los ratios de la ecuación de regresión.

Usando los términos del foro de operadores podemos decir que no deberíamos "sobreoptimizar" (¡aquí está la infame adaptación!) un sistema de trading, es decir, no debe perder sus características en los siguientes segmentos. El sistema no es adecuado para los segmentos de cotizaciones futuros debido al cambio de la esperanza matemática y la varianza en el tiempo.

Se realizarán las siguientes pruebas para los residuos: correlación serial, normalidad, heteroscedasticidad y heteroscedasticidad de los residuos condicional autorregresiva.

Los correlogramas - estadísticos Q muestran las autocorrelaciones de los residuos y calculan los estadísticos Q para los retrasos adecuados con la indicación del valor p.

El histograma - prueba de normalidad muestra el histograma y los estadísticos de los residuos descriptivos incluyendo el estadístico de Jarque-Bera en las pruebas de normalidad. Si los residuos se distribuyen según una normal, el histograma deberá tener forma de campana y los estadísticos de Jarque-Bera no deben ser significativos.

Las pruebas de heteroscedasticidad verifican la heteroscedasticidad de los residuos de la ecuación. Si hay una evidencia de heteroscedasticidad, es necesario o bien cambiar la especificación de la regresión (cambio del indicador) o modelar la heteroscedasticidad.

Vamos a usar la prueba de heteroscedasticidad de White con la hipótesis nula sobre la ausencia de heteroscedasticidad frete a la prueba de heteroscedasticidad de una forma común desconocida.

White describe su método como la prueba común para la especificación del modelo de error. Como la hipótesis nula, la prueba se basa en que los errores son tanto homoscedásticos como independientes de las variables independientes y que la especificación del modelo lineal es correcta. La exclusión de cualquiera de estos parámetros puede conducir a unos estadísticos de prueba significativos. Por el contrario, un estadístico de prueba no significativo implica que ninguno de los tres parámetros han sido violados.


1.7.3. Diagnósticos de estabilidad

La estabilidad del diagnóstico es lo más importante e interesante en este caso, ya que los resultados de los diagnósticos revelan las capacidades predictivas del indicador. En MT4 o MT5 la estabilidad puede diagnosticarse usando el probador de estrategias. Más adelante mostraremos que el probador de estrategias no puede diagnosticar la estabilidad futura de un sistema de trading creado usando los indicadores. Tan solo puede dar una evaluación de un sistema de trading basado en datos históricos.

Al igual que ocurre en las pruebas de los sistemas, el método común de diagnóstico de la estabilidad consiste en que las barras de cotización T se dividen en las observaciones T1 que se usarán para la evaluación y T2 = T - T1 barras que se usarán para pruebas y evaluación.

En caso de que un sistema de trading sea probado en dos segmentos el problema de su estabilidad futura no puede resolverse, ya que la prueba en el segundo segmento muestra solo que este nuevo segmento es similar al anterior por sus parámetros estadísticos desconocidos. Al mismo tiempo, los problemas estadísticos que se han resuelto durante la creación del sistema de trading siguen siendo desconocidos.

Por supuesto, se eligen segmentos de cotizaciones diferentes durante las pruebas de los sistemas de trading pero es imposible detectarlo a ojo, digamos, en las áreas de heteroscedasticidad o los segmentos de las cotizaciones, en los que los ratios de la regresión serán inestables.

A continuación se enumeran varias pruebas (no todas las pruebas de estabilidad). Con estas pruebas podemos estar seguros de que un sistema de trading mostrará un resultado estable en caso de que aparezcan las condiciones de prueba en una cotización en el futuro.

Por ejemplo, el cambio en la dirección de una tendencia de descendente a ascendente o viceversa es una prueba de un punto de interrupción. Si esta prueba no ha encontrado un punto de interrupción podemos estar seguros de que el indicador mostrará resultados estables en caso de que se produzca cualquier cambio en una tendencia.

Prueba de punto de interrupción de Quandt-Andrews

Hipótesis nula: ausencia de puntos de interrupción entre dos observaciones espaciadas de los extremos de la muestra en un 15%.

La prueba de punto de interrupción de Quandt-Andrews realiza la comprobación para uno o más puntos de interrupción de estructura desconocida en una muestra para una ecuación dada. La idea básica de la prueba de Quandt-Andrews es que se realiza una prueba separada del punto de interrupción de Chow para cada observación entre dos fechas u observaciones t1 y t2. El k de los estadísticos prueba de las pruebas de Chow se suma en un estadístico de prueba para la prueba frente a la hipótesis nula relativa a la ausencia de puntos de interrupción entre t1 y t2.

Prueba RESET de Ramsey

Hipótesis nula: el error en una regresión es un valor que se distribuye según una normal con media cero.

La correlación de las series, heteroscedasticidad o distribución anormal para todas violan la hipótesis de que los residuos se distribuyen con normalidad.

RESET - una prueba habitual para los siguientes tipos de errores de especificación:

  • Variables omitidas; X no incluye todas las variables adecuadas;
  • Forma funcional incorrecta: algunas o todas las variables en Y y X deben transformarse mediante un logaritmo, una potencia, un valor inverso o de cualquier otra forma;
  • La correlación entre X y e puede deberse a algunos factores incluyendo el error de medida de X o la presencia de un retraso y una correlación de las series de residuos.

Con dichos errores de especificación, las evaluaciones de OLS cambiarán (el error del sistema no es cero) y serán inválidas (no se ajusta a la cantidad evaluada por su probabilidad al incrementar el número de observaciones), por tanto, los procedimientos de resultados ordinarios no estarán justificados.

Residuos recurrentes

Las pruebas de residuos recurrentes se basan en las evaluaciones de regresión múltiples con el incremento gradual en el número de barras.

Prueba de predicción un paso hacia adelante

Si observamos la definición de los residuos recurrentes que presentamos antes, podemos ver que cada residuo recurrente es un error de predicción un paso hacia adelante. Si queremos comprobar la probabilidad de que el valor de la variable dependiente pase por el modelo adaptado a lo largo de todos los datos hasta el punto en el tiempo t, cada error debe compararse con su desviación estándar a partir de toda la muestra.

Estimaciones recurrentes de ratio

Este tipo permite seguir el cambio en las estimaciones para cualquier ratio cuando la cantidad de datos de la estimación en una muestra aumenta. La figura muestra los ratios seleccionados en la ecuación para todas las estimaciones recurrentes ejecutables. Las figuras muestran dos intervalos estándar alrededor de los ratios estimados.

En caso de que el ratio muestre un cambio significativo al añadir los datos a la ecuación de evaluación, ese será un signo seguro de inestabilidad. Las imágenes del ratio pueden a veces mostrar saltos drásticos, ya que la ecuación intenta vencer una ruptura estructural.

El análisis técnico dispone de un amplio rango de los llamados indicadores "adaptativos", aunque no hay ningún intento de determinar la necesidad actual de dicha adaptación. Las estimaciones recurrentes de ratios pueden resolver este problema.


2. Preparar los datos iniciales

Vamos a tomar los precios de las cotizaciones diarias de EURUSD del 11 de noviembre de 2010 al 23 de marzo de 2011 para nuestro análisis. Las cotizaciones se recibieron del terminal de MT4 por F2 y se exportaron a Excel.

El gráfico lineal de cotizaciones es el siguiente:

Fig. 5. Gráfico EURUSD

Fig. 5. Gráfico EURUSD

El ejemplo muestra la necesidad de controlar los datos que no aparecen en los indicadores. No debemos pensar que las cotizaciones mostradas son un caso especial de cotizaciones de poca calidad. Las omisiones de datos pueden ocurrir por varias razones. Además, debemos tener cuidado con los datos perdidos durante las vacaciones en USA. El problema de los datos perdidos se hace particularmente crítico cuando elaboramos sistemas de trading basados en varios factores económicos, como la correlación de los precios de las monedas y los índices de las acciones que no se comercian continuamente.

En nuestro caso simple, es posible realizar la interpolación lineal y atenuar la influencia de los datos perdidos sobre los cálculos al menos hasta cierto punto.

Además está el problema de los valores atípicos. El problema de los valores atípicos es más complicado que el de los datos perdidos. Antes de empezar a considerar los valores atípicos, debemos responder a la siguiente pregunta: ¿qué es un valor atípico? Yo creo que un valor atípico es un movimiento del precio que excede tres desviaciones estándar que no fue seguido por un posterior movimiento del precio.

Los valores atípicos vienen determinados no por las cotizaciones sino por sus residuos: vamos a calcular las series restando el valor del precio previo del siguiente - eurusd(i) - eurusd(i+1) (en notación de MQL5). La notación en inglés tiene varios nombres para este valor. Se distingue en el gráfico. La palabra "retornos" se usa más a menudo. Usaré la palabra "residuo" a partir de ahora. Es el valor obtenido después de eliminar una tendencia en las cotizaciones. El gráfico de residuos EURUSD es el siguiente:


Fig. 6. Residuo EURUSD

Fig. 6. Residuo EURUSD

La desviación estándar para las cotizaciones EURUSD es igual a 0,033209. Por tanto, no hay valores atípicos en nuestras cotizaciones según el criterio formulado para los mismos.

En caso de que haya valores atípicos, estos pueden sustituirse, digamos, por los valores de los datos omitidos y luego interpolamos.

Este método para eliminar los valores atípicos no es el único y, lo más importante, no es el correcto. Si el residuo comprende los residuos de las cotizaciones después de eliminar una tendencia, es evidente que el tamaños de los valores atípicos depende del método usado para calcular la tendencia, es decir, el problema de los valores atípicos deber considerarse después de resolver del problema de la determinación de la tendencia.

En este punto, la preparación de los datos básicos para el análisis posterior se considera completado.


3. Análisis de los parámetros estadísticos

El análisis de los parámetros estadísticos de las cotizaciones de Forex y el análisis de las cotizaciones EURUSD en particular se realiza para verificar la posibilidad de aplicar los indicadores para el análisis y la creación de sistemas de trading.

El algoritmo típico para crear un sistema de trading es el siguiente:

  1. Se selecciona un indicador (por ejemplo, la media móvil) y se crea el sistema de trading en base a él;
  2. Como normalmente es imposible construir un sistema de trading basado en un único indicador, se implementan indicadores adicionales en él para evitar las falsas entradas en el mercado.

El mantra "no ajustar en exceso, no ajustar en exceso" debe recalcarse también en esta etapa.


3.1. Estadística descriptiva

Sabemos a partir de la estadística que si una cotización ha estado sujeta a la ley de distribución normal como un valor aleatorio, el valor del error de cálculo promedio habría cambiado en caso de cambio en el número de periodos y coincidiría en el infinito con la esperanza matemática, que es constante para la ley normal. Las cotizaciones pudieron haberse reemplazado con una línea recta horizontal, y stop loss y take profit podrían haberse establecido en los niveles de las desviaciones estándar. Pero ese no es el caso. Vamos a ver las razones.

Comprobaremos la conformidad de las cotizaciones con la ley de distribución normal.

Vamos a crear un histograma de cotizaciones EURUSD de la siguiente forma:

Fig. 7. Histograma EURUSD

Fig. 7. Histograma EURUSD

El histograma muestra cuantas veces a surgido un precio definitivo dentro del rango que hemos elegido.

Según su apariencia, la distribución no es normal, dos crestas echan a perder toda la gráfica. Vamos a realizar la prueba de normalidad de Jarque-Bera con H0 como hipótesis nula: la distribución es normal. El resultado se muestra a continuación:

 Parámetro Valor (hecho) Valor teórico
Promedio
1,3549
El promedio debe ser igual a la mediana
Media
1,3580
La media debe ser igual a la mediana
Desviación estándar
0,0332
-
Asimetría (inclinación)
0,0909
0,0
Kurtosis
2,1052
3,0
Jarque-Bera
3,5773
0,0
Probabilidad
0,1671
1,0


Tabla 1. Resultado de la prueba de normalidad de la distribución

De acuerdo con el criterio de Jarque-Bera, la conclusión sobre la no conformidad con la normalidad no es tan dogmática ya que:

  • El promedio y la mediana casi coinciden
  • La asimetría está cerca de cero
  • La kurtosis está cerca de tres
  • Las discrepancias existentes están bien reflejadas por la última línea de "probabilidad", que muestra que la distribución es normal con una probabilidad del 16,7186%.

Podemos tener diferentes planteamientos frente a esta cifra. Por un lado, no podemos rechazar la hipótesis nula (una cotización se distribuye normalmente) a un nivel convencional de significatividad, como el 95%. Por otro lado, es imposible considerar que la distribución es normal en el 16%.

Como el promedio casi coincide con la mediana (una de las características de la distribución normal) vamos a comprobar si podemos confiar en los valores calculados para el promedio. Vamos a realizar la prueba para la igualdad del promedio dividiendo las cotizaciones en dos grupos:

El resultado es como se muestra a continuación:

EURUSD
 CantidadPromedio
Desviación estándar
 Error promedio
[1.25, 1.3)
4
1,2951
0,0034
0,0017
[1.3, 1.35)
42
1,3262
0,0125
0,0019
[1.35, 1.4)
48
1,3740
0,0133
0,0019
[1.4, 1.45)
9
1,4131
0,0083
0,0027
Todo
103
1,3549
0,0332
0,0032


Tabla 2. Comparando los valores promedio en los segmentos

Como muestra esta prueba, el promedio se calcula con un error teniendo el valor más típico de 19 puntos que pueden alcanzar las 32 unidades.

Teniendo esto en cuenta podemos concluir que no podemos usar el promedio.

La desviación estándar de 0,033209 parece muy sospechosa. ¡Estos son 332 puntos! En general, una desviación estándar tan grande es obvia: la cotización EURUSD tiene una tendencia que de hecho es un componente determinístico habitual que distorsiona cualquier característica estadística de las cotizaciones.


3.2. Prueba de la autocorrelación de las cotizaciones

El concepto de "aleatoriedad" se basa en la independencia de una cantidad aleatoria de valores entre sí. La apariencia de las cotizaciones permite encontrar las secciones del movimiento direccional, las tendencias.

El determinismo (presencia de una tendencia) implica la dependencia de los valores EURUSD adyacentes que pueden comprobarse calculando la autocorrelación (ACF), es decir, la correlación entre valores EURUSD adyacentes.

El resultado se muestra a continuación:

Fig. 8. Función de autocorrelación de las cotizaciones EURUSD

Fig. 8. Función de autocorrelación de las cotizaciones EURUSD

La probabilidad asociada al estadístico Q es la misma en todas partes e igual a cero.

Los cálculos muestran que:

  • El valor de la función de autocorrelación disminuye suavemente y ese descenso es probablemente regular.

La probabilidad calculada se refiere a la prueba con la hipótesis nula pero no hay correlación hasta el retraso 16 (en nuestro caso). Como la probabilidad es igual a cero para todos los retrasos, rechazamos estrictamente la hipótesis nula sobre la ausencia de autocorrelación (tendencia) en las cotizaciones.


3.3. Análisis de la estacionariedad de las cotizaciones

Vamos a realizar el análisis de la estacionariedad de las cotizaciones EURUSD usando la prueba de Dickey-Fuller en sus tres versiones: con un cambio, con una tendencia y sin cambio ni tendencia.

Los resultados de la prueba constan de dos partes: para EURUSD y para las cotizaciones EURUSD derivadas que se designan como D(EURUSD).

La hipótesis nula de esa prueba es que EURUSD no es estacionaria (tiene una raíz unitaria). Realizaremos los cálculos de no solo una raíz unitaria sino también de las características estadísticas de los resultados de la derivación de EURUSD. El grafico de derivación se presenta a continuación:

Fig. 9. Residuo de las cotizaciones EURUSD

Fig. 9. Residuo de las cotizaciones EURUSD

Puede concluirse visualmente que las cotizaciones derivadas EURUSD son oscilaciones aleatorias ubicadas aproximadamente alrededor de cero.

Vamos a examinar los tres métodos de cálculo de la prueba de estacionariedad de las cotizaciones EURUSD.

1. Las cotizaciones sin cambio (una constante) y una tendencia, para las que la regresión tiene el siguiente aspecto:

D(EURUSD) = С(1) * EURUSD(1) + С(2) * D(EURUSD(1))

Probabilidad de aceptar la hipótesis nula (la serie no es estacionaria): 0,6961

 VariableRatio
estadístico tProbabilidad de ser igual a cero
 EURUSD(1)
3,09E-05
0,0488
0,9611
 D(EURUSD(1))
0,2747
2,8759
0,0049

Tabla 3. Resultados de la prueba de estacionariedad considerando el cambio y la tendencia

Evaluación del ajuste de la regresión a D(EURUSD) por R-cuadrado: 0,07702.

Pueden sacarse las siguientes conclusiones a partir de los datos:

  1. Las cotizaciones EURUSD deben reconocerse como no estacionarias con alta probabilidad (69%). No rechazamos la hipótesis nula estrictamente;
  2. El incremento de D(EURUSD) no depende el valor del precio previo con una probabilidad del 99,5%.
  3. D(EURUSD) depende por completo del incremento previo de D(EURUSD(1));
  4. El valor del ratio de R-cuadrado = 0,077028 muestra la completa falta de cumplimiento de la regresión con las cotizaciones derivadas D(EURUSD).

2. Cotización EURUSD con un cambio (una constante) para la que la regresión tiene el siguiente aspecto:

D(EURUSD) = С(1) * EURUSD(1) + С(2) * D(EURUSD(1)) + С(3)
 VariableRatio
estadístico tProbabilidad de ser igual a cero 
 EURUSD(1)
-0,0445
-1,6787
0,0964
 D(EURUSD(1))
0,3049
 3,1647
0,0021
 С 0,0603 1,68030,0961


Tabla 4. Resultados de la prueba de estacionaridad considerando el cambio

Probabilidad de aceptar la hipótesis nula (la serie no es estacionaria): 0,4389

Evaluación del ajuste de la regresión a D(EURUSD) por R-cuadrado: 0,1028

Pueden sacarse las siguientes conclusiones a partir de los datos:

  1. Las cotizaciones EURUSD deben reconocerse como no estacionarias con alta probabilidad (43%). No rechazamos la hipótesis nula estrictamente;
  2. No debemos incluir el valor del precio de EURUSD previo y una constante (un cambio) en la ecuación de regresión para el incremento de D(EURUSD), ya que consideramos estos ratios iguales a cero para un nivel de significatividad del 5%.
  3. D(EURUSD) depende por completo del incremento previo de D(EURUSD(1));
  4. El valor del ratio de R-cuadrado = 0,102876 muestra la completa falta de cumplimiento de la regresión con las cotizaciones derivadas D(EURUSD).

3. Cotización EURUSD con un cambio (una constante) y una tendencia, para el que la regresión tiene el siguiente aspecto:

D(EURUSD) = С(1) * EURUSD(1) + С(2) * D(EURUSD(1)) + С(3) + С(4) * TREND

Probabilidad de aceptar la hipótesis nula (la serie no es estacionaria): 0,2541

 VariableRatio
estadístico t
Probabilidad de ser igual a cero 
EURUSD(-1)
-0,0743
-2,6631
0,0091
D(EURUSD(-1))
0,2717
2,8867
0,0048
C
0,0963
2,5891
0,0111
TREND(11/01/2010)
8,52E-05
2,7266
0,0076

Tabla 5. Resultados de la prueba de estacionariedad considerando el cambio y la tendencia

Evaluación del ajuste de la regresión a D(EURUSD) por R-cuadrado: 0,1667

Pueden sacarse las siguientes conclusiones a partir de los datos:

  1. Las cotizaciones EURUSD deben reconocerse como no estacionarias con alta probabilidad (25%). No rechazamos la hipótesis nula estrictamente;
  2. Aunque la probabilidad de que el ratio sea igual a cero durante la tendencia es menor del 1%, el valor de este ratio es extremadamente pequeño, es decir, la tendencia es una línea horizontal;
  3. El valor del ratio de R-cuadrado = 0,166742 muestra la completa falta de cumplimiento de la regresión con las cotizaciones derivadas D(EURUSD).

A partir de estos cálculos puede sacarse la siguiente conclusión: en caso de que las cotizaciones básicas EURUSD no sean estacionarias, la primera derivada obtenida al restar el valor del precio previo del siguiente es probablemente estacionaria.

En este caso hemos eliminado una tendencia y un cambio, que pueden describirse por la siguiente ecuación:

eurusd = c(1) * trend + c(2),

donde c(1) y c(2) son constantes que pueden ser evaluadas por el método de mínimos cuadrados.

La ecuación es una ecuación de regresión común que coincide completamente con la herramienta "regresión" en el terminal MT4. Hemos reemplazado la cotización básica por la línea recta. Es un método muy utilizado en el análisis técnico, ya que podemos llamar fácilmente a un amplio rango de instrumentos consistentes en líneas rectas: canales, niveles de apoyo y resistencia, niveles de Fibonacci, Gann, etc.

Las líneas rectas son la primera herramienta que usa cualquier operador en los mercados. Pero ¿por qué confiamos en esta herramienta? ¿Por qué consideramos a las líneas rectas fiables ? Responderemos a estas preguntas más tarde en el artículo.

Además de las líneas rectas, los indicadores que reemplazan cotizaciones básicas con algunas curvas también se usan en el análisis técnico. Lo haremos del mismo modo y tomaremos dos indicadores conocidos para el análisis: la media móvil exponencial y el filtro Hodrick-Prescott.


4. Reducción de la tendencia de las cotizaciones

El uso de la expresión "reducción de tendencia" pretende enfatizar la conexión de esta sección con la noción correspondiente de la econometría. Más exactamente y según el modelo previamente declarado de mercados financieros, debemos hablar sobre la eliminación (reducción de la tendencia) de un componente regular de las cotizaciones.

Hemos determinado tres componentes regulares en nuestro caso: la tendencia lineal, la media móvil exponencial y el filtro Hodrick-Prescott.

Todos los componentes regulares se considerarán series de tiempo.


4.1. Tendencia lineal

Vamos a establecer la tendencia lineal añadiendo uno de los valores previos.

Evaluaremos los ratios de regresión lineal:

eurusd = c(1) * trend + c(2),

Tenemos el gráfico combinado de una cotización básica EURUSD, la línea recta de regresión cambiada verticalmente y el residuo obtenido mediante deducción de la línea de regresión a partir de la cotización:

Fig. 10. Gráfico, regresión lineal y residuo de EURUSD

Fig. 10. Gráfico, regresión lineal y residuo de EURUSD

Ahora evaluamos la siguiente ecuación usando el método de mínimos cuadrados:

EURUSD = С(1)*TREND + С(2)

La evaluación de la ecuación de regresión se acompaña de los siguientes datos:

Variable
Ratio
 estadístico t Probabilidad de ser igual a cero
TENDENCIA
0,0004
4,4758
0,0000
C
1,3318
223,3028
0,0000

Tabla 6. Resultados de la prueba de estacionariedad de la tendencia lineal

Evaluación del ajuste de la regresión a la cotización de R-cuadrado = 0,1655.

Pueden sacarse las siguientes conclusiones a partir de los datos:

  1. Según el ratio de determinación de R-cuadrado, la línea recta puede explicar los cambios en las cotizaciones solo en el 16% de los casos;
  2. El residuo obtenido a partir de la deducción de la tendencia lineal de las cotizaciones difiere mínimamente de la propia cotización. Aparentemente, tendrá los mismos defectos estadísticos que la cotización.


4.2. Ajuste exponencial.

Elegiremos el algoritmo de Holt-Winters sin componente estacional con parámetros de ajuste para una cotización (nivel) y una tendencia para el ajuste exponencial.

Idea principal del método:

  • Eliminar la tendencia de las series de tiempo separando el nivel de la tendencia;
  • Ajustar el nivel (un parámetro);
  • Ajustar la predicción de la tendencia (parámetro b).

El resultado obtenido se muestra en la figura.

Fig. 11. Media móvil exponencial

Fig. 11. Media móvil exponencial

Hemos recibido una media móvil exponencial estándar que se retrasa un poco pero muestra la cotización lo suficiente. Los parámetros de ajuste se muestran en la parte superior y la selección de los parámetros no se ha realizado.

Ahora evaluamos la siguiente ecuación usando el método de mínimos cuadrados:

EURUSD = С(1)*EURUSD_EX +С(2)

La evaluación de la ecuación de regresión se acompaña de los siguientes datos:

Variable
Ratio
 estadístico tProbabilidad de ser igual a cero
EURUSD_EX
0,9168
24,3688
 0,0000
C
0,1145
2,2504
 0,0266


Tabla 7. Resultados de la evaluación de regresión lineal

Evaluación del ajuste de la regresión a la cotización de R-cuadrado = 0,8546.

Pueden sacarse las siguientes conclusiones a partir de los datos:

  1. Según el ratio de determinación de R-cuadrado, la media móvil exponencial puede explicar los cambios en las cotizaciones solo en el 84% de los casos;
  2. El residuo obtenido a partir de la deducción del promedio exponencial de la cotización es similar a un proceso aleatorio con la distribución normal. Vamos a considerar que tiene algún sentido en el análisis posterior de ese residuo.


4.3. Filtro Hodrick-Prescott

El filtro Hodrick-Prescott tiene el parámetro lambda.

No trabajaremos con la selección de este parámetro y lo consideraremos igual a 8.162.

El resultado se muestra a continuación:

Fig. 12. Filtro Hodrick-Prescott

Fig. 12. Filtro Hodrick-Prescott

Ahora evaluamos la siguiente ecuación usando el método de mínimos cuadrados:

EURUSD = С(1)*EURUSD_HP + С(2)

La evaluación de la ecuación de regresión se acompaña de los siguientes datos:

Variable
Ratio
estadístico t
 Probabilidad de ser igual a cero
EURUSD_HP
1,0577
23,9443
0,0000
C
-0,0782
-1,3070
0,1942


Tabla 8. Resultados de la evaluación de ajustar la regresión a las cotizaciones

Evaluación del ajuste de la regresión a la cotización de R-cuadrado = 0,8502.

Pueden sacarse las siguientes conclusiones a partir de los datos:

  1. La probabilidad de que el segundo ratio (la constante) sea igual a cero es del 19%. Esto pone en duda el uso de la constante en la ecuación de regresión;
  2. Según el ratio de determinación de R-cuadrado, la media el filtro Hodrick-Prescott puede explicar los cambios en las cotizaciones solo en el 85% de los casos;
  3. El residuo obtenido a partir de la deducción del filtro Hodrick-Prescott de la cotización es similar a un proceso aleatorio con la distribución normal y tiene sentido analizarlo posteriormente.


5. Diagnósticos de ratios

Los diagnósticos de ratios incluyen las siguientes pruebas:

  1. La elipse de confianza define la correlación entre los ratios de la ecuación de regresión: cuanto más cerca esté la elipse a un círculo, menor será la correlación;
  2. El intervalo de confianza define los límites de variación de los ratios de la ecuación. En el análisis técnico los ratios son las constantes que normalmente pueden cambiarse usando el parámetro "periodo" o de alguna otra forma. Pero en cualquier caso, los ratios no se consideran valores aleatorios. Vamos a comprobar si esto es cierto.
  3. Prueba de variables omitidas - se considera la hipótesis nula: una variable independiente adicional no es significativa.
  4. Prueba de variables recurrentes - hipótesis nula: el ratio de la variable adicional es igual a cero;
  5. Las pruebas de los puntos de interrupción determinan la presencia de los puntos de cambio en las características estadísticas de las cotizaciones. Vamos a comprobar los puntos de cambio de la tendencia en términos del análisis técnico en el papel de los puntos de cambio mencionados. En la cotización EURUSD analizada podemos asignar al menos dos tendencias: descendente y ascendente (aquí ignoramos un movimiento plano).

5.1. Elipse de confianza

Vamos a crear elipses de confianza para cada una de las ecuaciones de regresión:

Fig. 13. Elipse de confianza para la ecuación de regresión 1

Fig. 13. Elipse de confianza para la ecuación de regresión 1

Fig. 14. Elipse de confianza para la ecuación de regresión 2

Fig. 14. Elipse de confianza para la ecuación de regresión 2

Fig. 15. Elipse de confianza para la ecuación de regresión 3

Figura 15. Elipse de confianza para la ecuación de regresión 3


Pueden sacarse las siguientes conclusiones a partir de las figuras:

  1. La correlación de los ratios para la regresión de la tendencia lineal está presente y puede evaluarse en torno a 0,5;
  2. La correlación para la regresión con la media móvil exponencial y el filtro Hodrick-Prescott es prácticamente igual a uno, lo que requiere la exclusión de las constantes de las ecuaciones de regresión. La probabilidad significativa de la constante igual a cero apoya la idea de su exclusión de la ecuación de regresión con el filtro Hodrick-Prescott.


5.2. Intervalo de confianza

Vamos a comprobar la hipótesis de que las constantes en la ecuación de regresión son valores aleatorios.

Para hacer esto, debemos crear los intervalos de confianza.

 Variable  Ratio Intervalo de confianza al 90% Intervalo de confianza al 95%
Borde inferior
Borde superior
% del intervalo
Borde inferior Borde superior % del intervalo
TENDENCIA
0,0004
0,0002
0,0006
74,3362
0,0002
0,0006
88,7168
C
1,3318
1,3219
1,3417
1,4868
1,3200
1,3436
1,7767
        
EURUSD_EX
0,9168
0,8543
0,9793
13,6247
0,8422
0,9914
16,2810
C
0,1145
0,0300
0,1991
147,5336
0,0135
0,2155
176,2960
        
EURUSD_HP
1,0577
0,9844
1,1310
13,8661
0,9701
1,1453
16,5694
C
-0,0782
-0,1776
0,0211
254,0276
-0,1970
0,0405
303,5529


Tabla 9. Niveles de confianza de los ratios de regresión

Observando los intervalos de confianza podemos ver que el ratio es un valor aleatorio que se comporta según su estado: mientras la confianza disminuye (canal con contracciones), el ancho del intervalo aumenta.

La columna "% del intervalo" es de gran interés ya que representa la relación porcentual del ancho del intervalo del valor del ratio respecto al valor del ratio. Como podemos ver, esta cantidad para las constantes de regresión con el promedio exponencial y el filtro tiene valores absolutamente inaceptables de más del 100%! Es necesario mencionar de nuevo que los ratios de correlación entre los dos ratios de estas ecuaciones son casi iguales a uno.

Vamos a eliminar la constante de las ecuaciones y a volver a evaluar los ratios de regresión.

Se obtendrán los siguientes resultados:

 Variable  Ratio Intervalo de confianza al 90% Intervalo de confianza al 95%
Borde inferior Borde superior % del intervalo Borde inferior Borde superior % del intervalo
EURUSD_EX1,0014
0,9999
1,0030
0,3131
0,9996
1,0033
0,3742
EURUSD_HP
1,0000
0,9984
1,0015
0,3127
0,9981
1,0018
0,3737

Tabla 10. Niveles de confianza de los ratios de regresión recalculados

No mostraré los nuevos cálculos para las regresiones con el promedio exponencial y el filtro para no hacer el artículo muy extenso.

Solo mencionaré que las siguientes ecuaciones de regresión se usarán más tarde:

EURUSD = 1.00149684612*EURUSD_EX

EURUSD = 1.00002609628*EURUSD_HP


5.3. Variables omitidas y excesivas (indicadores)

Un algoritmo de creación de sistemas de trading típico comprende los siguientes pasos. Se toma y utiliza algún indicador para pruebas de un sistema de trading. Luego se añade un indicador adicional para clasificar falsos inicios del sistema de trading, etc.

Este algoritmo no puede mostrar cuándo el operador debe parar. No puede indicar si son necesarios algunos indicadores adicionales o si es necesario excluir algunos del sistema de trading. La teoría existente de creación de sistemas de trading no puede responder a estas preguntas, pero las respuestas no pueden encontrarse cuando hacemos la prueba para variables omitidas y excesivas (indicadores).

Prueba de variables omitidas: se considera la hipótesis nula, es decir, una variable independiente adicional no es significativa.

Vamos a crear un indicador complejo a partir de los tres que tenemos:

EURUSD = C(1)*TREND + C(2) + C(3)*EURUSD_EX + C(4)*EURUSD_HP

Al evaluar los ratios de este indicador integral (regresión) obtendremos el siguiente resultado:

EURUSD = 1.41879198369e-05*TREND - 0.00319950161771 + 0.50111527265*EURUSD_EX + 0.501486719095*EURUSD_HP

La probabilidad de que los ratios apropiados sea igual a cero se muestra en la siguiente tabla:

 Variable RatioProbabilidad de ser igual a cero
TENDENCIA
 1,42E-05
 0,7577
C
 -0,0032
 0,9608
EURUSD_EX
 0,5011
 0,0000
EURUSD_HP 0,5014 0,0004


Tabla 11. Evaluación de que la probabilidad de los ratios del indicador sea igual a cero

La tabla muestra que no deberíamos haber incluido el indicador TENDENCIA y la constante, ya que podemos garantizar que sus ratios son iguales a cero.

Vamos a añadir un indicador integral más (el cuadrado del promedio exponencial eurusd_ex^2) al anterior y realizar la prueba de la variable omitida (eurusd_ex^2) con la hipótesis nula: la variable adicional eurusd_ex^2 no es significativa.

De acuerdo con los estadísticos t y F calculados, la probabilidad de que la variable adicional (eurusd_ex^2) no sea significativa es igual a 44,87%. Sobre esta base, puede afirmarse que los indicadores adicionales no son necesarios en nuestro sistema de trading.

Pero aún más interesante es la estimación del indicador completo con eurusd_ex^2 añadido en la tabla:

Variable
 RatioProbabilidad de ser igual a cero
TENDENCIA
1,69E-05
0,7154
C
1,9682
0,4496
EURUSD_EX
-2,3705
0,5317
EURUSD_HP
0,4641
0,0020
EURUSD_EX^2
1,0724
0,4487

Tabla 12. Evaluación de que la probabilidad de los ratios del indicador completo sea igual a cero con eurusd_ex^2

La tabla muestra que solo el indicador basado en el filtro Hodrick-Prescott es de algún interés.

Prueba de variables recurrentes - hipótesis nula: el ratio de la variable adicional es igual a cero.

Vamos a examinar esto desde el otro lado y a realizar la prueba de variables recurrentes con la hipótesis nula: el ratio de la variable recurrente es igual a cero. En nuestro indicador complejo indicaremos la tendencia c como variables recurrentes.

De acuerdo con los estadísticos t y F calculados, la probabilidad de que la tendencia y las variables recurrentes c sea igual a cero es del 92,95%. Sobre esta base, puede afirmarse que nuestro sistema de trading tiene una tendencia y variables redundantes c. Esto se corresponde bastante bien con los resultados anteriores.

La evaluación del indicador completo consistente en el promedio exponencial y el filtro Hodrick-Prescott tiene el siguiente aspecto:

Variable
Ratio
Probabilidad de ser igual a cero
EURUSD_EX
0,4992
0,00
EURUSD_HP
0,5015
0,00


Tabla 13.
Evaluación de la probabilidad de que los ratios del indicador completo sea igual a cero, en caso de que este indicador conste del promedio móvil exponencial y el filtro Hodrick-Prescott

Es decir, no tenemos dudas sobre la utilidad de usar estos indicadores en el sistema de trading.


6. Diagnósticos de residuos

6.1. Autocorrelación - estadísticas Q

Fig. 16. Función de autocorrelación después de la deducción de la tendencia lineal

Fig. 16. Función de autocorrelación después de la deducción de la tendencia lineal

El correlograma muestra que la deducción de la tendencia lineal de las cotizaciones básicas no niega la presencia de una tendencia, como muestra ACF. La probabilidad de ausencia de correlación es igual a cero, es decir, rechazamos estrictamente la hipótesis nula en todos los niveles de significatividad.

Fig. 17. Función de autocorrelación después de la deducción del ajuste exponencial

Fig. 17. Función de autocorrelación después de la deducción del ajuste exponencial

El correlograma muestra que la deducción de la curva exponencial de la cotización básica ha excluido la tendencia en todas las velas mayores que la segunda, como muestra ACF.

Según los cálculos, la probabilidad de ausencia de correlación es igual a cero, es decir, rechazamos estrictamente la hipótesis nula en todos los niveles de significatividad.

Pero si nos esforzamos algo más y excluimos la correlación en las primeras dos velas, podremos obtener el residuo sin correlaciones.

Fig. 18. Función de autocorrelación después de la deducción del filtro Hodrick-Prescott

Fig. 18. Función de autocorrelación después de la deducción del filtro Hodrick-Prescott

El correlograma muestra que la deducción del filtro Hodrick-Prescott de la cotización básica ha excluido la tendencia en todas las velas mayores que la tercera, como muestra ACF. La probabilidad de ausencia de correlación es igual a cero, es decir, rechazamos estrictamente la hipótesis nula en todos los niveles de significatividad. Pero si nos esforzamos algo más y excluimos la correlación en las primeras dos velas, podremos obtener el residuo sin correlaciones.

Conclusión. El intento de eliminar el componente determinista deduciendo nuestros indicadores de la cotización básica EURUSD ha fallado por completo para la tendencia líneal y ha tenido éxito parcial para la media móvil exponencial y el filtro Hodrick-Prescott.

El análisis posterior de nuestros indicadores deja de tener sentido debido a la correlación (componente determinista). Debemos encontrar un indicador que permita excluir la autocorrelación de los residuos. Haremos esto en la próxima sección.


7. Creación y examen del análisis considerando el indicador

Actualmente no tenemos una teoría formal para crear un conjunto de indicadores. La única forma es la búsqueda directa con la selección de algunos según los resultados de los análisis.

A partir del análisis de correlación previo, se concluyó que la autocorrelación en las primeras velas de las cotizaciones se mantuvieron después de la reducción de la tendencia.

Vamos a examinar la siguiente ecuación considerando dicho efecto:

EURUSD = C(1)*EURUSD_HP(1) + C(2)*D(EURUSD_HP(1)) + C(3)*D(EURUSD_HP(2))

D(EURUSD_HP(1)) significa el residuo entre la cotización y el ajuste del filtro Hodrick-Prescott, el primer retraso (la segunda barra, no la primera al calcular las barras comenzando por una).

La evaluación de los ratios de esa ecuación con el uso del método de mínimos cuadrados lleva a los siguientes resultados:

 VariableRatio
Probabilidad de ser igual a cero
EURUSD_HP(1)
1,0001
0,0000
D(EURUSD(1))
0,8262
0,0000
D(EURUSD(-2))
-0,48810,0000


Tabla 14. Resultados de la evaluación de los ratios usando el método de mínimos cuadrados

Según la prueba de las variables excesivas y los estadísticos t y F, la probabilidad de que los ratios en presencia de las variables eurusd(1) y eurusd(2) sean iguales a cero es nula, es decir, estas dos variables no son excesivas.

La autocorrelación muestra la ausencia de dependencias hasta el retraso 16 con la probabilidad mayor del 70% (primera línea distintiva):


Fig. 19. Autocorrelación del residuo

Fig. 19. Autocorrelación del residuo

La prueba de heteroscedasticidad de White da el resultado de los estadísticos F confirmando que la heteroscedasticidad está ausente con una probabilidad del 80%.

Examen del punto de interrupción según la prueba Quandt-Andrews con la hipótesis nula: "sin puntos de interrupción" da el resultado y la hipótesis nula es aceptada con una probabilidad del 71% (sin puntos de interrupción).

Debe señalarse una vez más que las cotizaciones examinadas tienen al menos un punto de interrupción (una inversión de la tendencia) según el análisis técnico estándar. Pero nuestro indicador tiene parámetros estadísticos similares tanto para las tendencias ascendentes como descendentes y, por tanto, es invariante respecto al estado del mercado.

La prueba integral de Ramsey con la hipótesis nula: "los errores al gestionar la regresión son un valor distribuido normalmente" con la probabilidad del 48% por t y F aceptada. Sobre esta base, podemos negar la autocorrelación del residuo y su heteroscedasticidad.

Esto también significa que las evaluaciones de cuadrados lineales no están cambiadas (la expresión matemática del valor examinado coincide con el valor examinado) y es posible realizar la prueba de residuos recurrentes.

Vamos a probar la predicción de residuos recurrentes en un paso hacia el futuro. La parte superior de la figura da los residuos recurrentes y las líneas de limitación en dos desviaciones estándar. Además, el eje izquierdo muestra la probabilidad de las velas de las cotizaciones en la que la hipótesis de la constancia del ratio del indicador se desviaría con un nivel de significatividad del 5%, 10% y 15%. No hay tantos puntos de este tipo pero su existencia significa un inicio falso de las órdenes stop loss y take profit.

Fig. 20. Prueba de predicción de los residuos recurrentes

Fig. 20. Prueba de predicción de los residuos recurrentes

Vamos a nombrar las estimaciones recurrentes de los ratios de la ecuación de regresión. El gráfico está formado por valores de ratios para la barra izquierda más alejada que son calculados. La barra uno se añade y los valores de los ratios se calculan una y otra vez hasta la última barra. En caso de una pequeña cantidad de barras en el lado izquierdo, los valores de los ratios son muy inestables, por supuesto. Sin embargo, mientras que el número de barras usadas para el cálculo se incrementa, la estabilidad (constancia) también se refuerza.

Fig. 21. Estimaciones recurrentes del ratio C(1)

Fig. 21. Estimaciones recurrentes del ratio C(1)

Fig. 22. Estimaciones recurrentes del ratio C(2)

Fig. 22. Estimaciones recurrentes del ratio C(2)

Fig. 23. Estimaciones recurrentes del ratio C(3)

Fig. 23. Estimaciones recurrentes del ratio C(3)

La figura muestra que se ha observado cierta inestabilidad al comienzo del intervalo de las cotizaciones pero puede considerarse que los valores de los ratios se han vuelto estables. Sin embargo, estrictamente hablando, los ratios de nuestra ecuación de regresión no son constantes.


Conclusión


Este artículo ha presentado una prueba más del hecho de que los datos financieros no son estacionarios. El método estándar de división de datos no estacionarios en una suma de datos se ha usado en el artículo para obtener un residuo estacionario.

Teniendo un residuo estacionario de cotizaciones básicas podemos responder a la pregunta principal relativa a la estabilidad del indicador obtenido.

La información contenida en el artículo es solo el principio de la creación de un sistema de trading que no debe basarse en las predicciones de las cotizaciones.


Bibliografía.

EViews 7. Guía del usuario II


Traducción del ruso hecha por MetaQuotes Ltd.
Artículo original: https://www.mql5.com/ru/articles/320

Uso del análisis discriminante para desarrollar sistemas de trading Uso del análisis discriminante para desarrollar sistemas de trading
Al desarrollar un sistema de trading, surge normalmente un problema en relación a la elección de la mejor combinación de indicadores y sus señales. El análisis discriminante es uno de los métodos que existen para encontrar esas combinaciones. El artículo muestra un ejemplo del desarrollo de un EA para la recogida de datos del mercado y explica el uso del análisis discriminante para crear modelos de pronóstico para el mercado FOREX en el software Statistica.
Predicción de series de tiempo usando el ajuste exponencial Predicción de series de tiempo usando el ajuste exponencial
Este artículo familiariza al lector con los modelos de ajuste exponencial utilizados en la predicción a corto plazo de series de tiempo. Además, toca los temas relacionados con la optimización y estimación de los resultados de las predicciones y proporciona algunos ejemplos de scripts e indicadores. Este artículo será útil como primera toma de contacto con los principios de la predicción basados en los modelos de ajuste exponencial.
Predicción de series de tiempo usando el ajuste exponencial (continuación) Predicción de series de tiempo usando el ajuste exponencial (continuación)
Este artículo pretende actualizar el indicador creado anteriormente y trata brevemente sobre un método para estimar intervalos de confianza en las predicciones usando bootstrapping y cuantiles. Como resultado, obtendremos el indicador de predicción y los scripts a usar para la estimación de la precisión de la predicción.
Gestor de evento "Nueva barra" Gestor de evento "Nueva barra"
El lenguaje de programación MQL5 es capaz de resolver problemas a un nuevo nivel. Incluso aquellas tareas que ya tienen soluciones, gracias a la programación orientada a objetos pueden subir a un nivel superior. En este artículo veremos un sencillo ejemplo sobre la comprobación de una nueva barra en un gráfico, transformada en una herramienta más potente y versátil. ¿Qué herramienta? Lo veremos en este artículo.