Discusión sobre el artículo "R cuadrado como evaluación de la calidad de la curva del balance de la estrategia" - página 3

 
fxsaber:

En el documento, la regresión lineal se considera con un error - a través de CLinReg::LRLine.

Prueba

Resultado

El signo es incorrecto. La implementación alternativa de LR (CAlglib::LRBuild + CAlglib::LRUnpack) cuenta correctamente:

No sé, he comprobado la igualdad, el sistema LR al cuadrado es exactamente igual a R^2. En cuanto al signo - parece difícil cometer un error aquí.
 
fxsaber:

Aquí es donde me equivoqué. Para mí no es una afirmación obvia en absoluto

Así que decidí confirmarlo experimentalmente mediante una animación (no puedo fiarme sólo de tu palabra).

Parece que es verdad.

Esto es realmente genial. Esta animación debería insertarse en el artículo. Si no te importa, lo haré.

 

En general, toda estadística es un campo para hoolivar.

Pero, el artículo es interesante en dos direcciones:

  • Mejora de R^2: cambiarlo para que el indicador sobre paseos aleatorios genere una distribución normal con una media de 0.0.
  • Investigación de teoremas arcosinos muy poco triviales, investigación de tendencias estocásticas. Paralelismos entre tendencias estocásticas y tendencias en los mercados.

 
Vasiliy Sokolov:
No sé, he comprobado la igualdad, el sistema LR al cuadrado es exactamente igual a R^2. En cuanto al signo - parece que es difícil cometer un error aquí.

Usted tiene que ejecutar este código varias veces hasta que pueda ver la diferencia en el signo. El gráfico muestra especialmente un gráfico para la auto-comprobación - R2. Y R es su algoritmo de cálculo.

Puedes ver que R difiere a veces del R2 exactamente correcto. Sería necesario ajustar de alguna manera tu forma de calcular la regresión para que el signo coincida, porque es un orden de magnitud más rápida que la de comprobación.

Probablemente, usted debe proporcionar la matriz de origen, que muestra el error. Entonces será obvio de inmediato.

Vasiliy Sokolov:

Esto está muy bien. ¡Esta animación debe ser insertado en el artículo! Si no te importa, lo haré.

A continuación, el código de animación sería bueno para terminar a un estado normal, porque lo hice yo mismo en una mano a toda prisa en condiciones de matorral. Y gifku, respectivamente, para hacer más visual.

 
fxsaber:

La equidad para el cálculo de R^2 debe calcularse no como EquidadCuenta ( == SaldoCuenta + Suma(Beneficio[i])), sino como Suma(Beneficio[i] / Lotes[i]) (para TS de un carácter).

¿Qué ocurre si la MM de la estrategia se basa en el tamaño del SL, y el propio SL es dinámico?
Dos operaciones vecinas pueden tener lotes diferentes y, en consecuencia, obtener beneficios al tomar el mismo número de pips.
Aunque el riesgo por operación será el mismo.

 
Andrey Khatimlianskii:

¿Qué pasa si la MM de la estrategia se basa en el tamaño del SL, y el propio SL es dinámico?
Dos operaciones vecinas pueden tener lotes diferentes y, en consecuencia, obtener beneficios al tomar el mismo número de pips.
Aunque el riesgo por operación será el mismo.

No entiendo qué cambia en esta situación.

 
fxsaber:

No veo qué diferencia hay en esta situación.

Sí, soy tonto. Dividir por lote daría el mismo resultado.

 

El autor muestra una falta total de comprensión de los procesos de azar. Todas las conclusiones del artículo no tienen nada que ver con el concepto mismo de azar y engañan a la gente.


Permítanme explicar esta opinión.

Al principio del artículo se da una definición:

Laregresión lineal es una dependencia lineal de una variable y con respecto a otra variable independiente x, expresada mediante la fórmula y = ax+b. En esta fórmula, a es el multiplicador y b es el coeficiente de sesgo


La regresión lineal NO se expresa mediante la fórmula

y = ax+b es una fórmula de ecuación lineal

sino que se expresa mediante la fórmula

y = ax+b + error

El error debe estar DISTRIBUIDO NORMALMENTE, y si no lo está, surgen muchos matices que limitan mucho la aplicación de la regresión lineal.

Es importantísimo darse cuenta de que los coeficientes de regresión lineal, a diferencia de la ecuación lineal, NO son constantes, son valores de azar y si se toma un ajuste de regresión lineal estándar, por ejemplo en R, siempre para los coeficientes de regresión lineal se especifica la desviación de ese valor de coeficientes, así como la probabilidad (probabilidad en la hipótesis nula de NO EVIDENCIA DE ESTE COEFICIENTE). Una vez más: a diferencia de una ecuación lineal, los coeficientes de regresión lineal pueden no existir en absoluto. Por eso el coeficiente R2 comentado en el artículo sólo tiene sentido para regresiones en las que la probabilidad de inexistencia de los coeficientes de regresión sea inferior al 10%. En las series financieras, nunca he visto que los coeficientes de regresión lineal sean significativos y, por lo tanto, es posible utilizar esta misma regresión lineal.

[Eliminado]  
fxsaber:

En el documento, la regresión lineal se considera con un error - a través de CLinReg::LRLine.

Prueba


Resultado


El signo es incorrecto. La implementación alternativa de LR (CAlglib::LRBuild + CAlglib::LRUnpack) cuenta correctamente:



Sí, con un error, tienes razón, el mejor resultado se determina entre conjuntos con pérdidas, aunque hay positivos con el mismo R2


Todo es correcto con tu versión:

 
fxsaber:

el criterio para encontrar una función lineal llamada "Regresión Lineal" es el MNC de las varianzas o lo que es lo mismo - la maximización del valor absoluto del RQ de Pearson, que es MathAbs(LR). Y maximizar MathAbs( LR) es lo mismo que maximizar R^2, ya que MathAbs(LR) = MathSqrt(R^2).

El MNC de los valores atípicos es MathMin((Sum(X[i] - LR[i])^2)).

Lo que se desea es muy diferente - MathMin((Sum(X[i] - LR[i])^2 * (i / Longitud)^2)). Es decir, incluso un error grande al principio del intervalo puede tener un efecto menor en el resultado que un error pequeño al final del intervalo.

LR clásico no tiene esto en cuenta, todos los errores son "iguales" allí.

Por favor, sugiera una función en R que dé diferentes pesos a los errores.