Distribución de los incrementos de precio - página 15

 
nahdi:

En realidad, eso es lo que quería preguntar: ¿por qué un físico experimentado, un estadístico (o lo que sea) estaría interesado en este tema? ¿No sería mejor que las finanzas fueran manejadas por los financieros? Cada uno debería ocuparse de sus propios asuntos. Y si no lo hay, da que pensar.

O el físico es una vocación, como decía el Sr. Medvedev... Si quieres dinero, métete en un negocio. Si quieres perder dinero, entra en los mercados financieros...


Estoy de acuerdo. Desde el punto de vista de los conceptos y valores de la vida común - no tengo nada que hacer en Forex (como físico), porque necesito una comprensión clara del proceso expresado en fórmulas analíticas. Pero, aun así, a veces vengo al foro con algunos resultados teóricos. Ahora es como un pasatiempo para mí - no para beber vodka en mi tiempo libre, de verdad:))))

 
Alexander_K:

Estoy de acuerdo. En cuanto a los conceptos y valores de la vida ordinaria - no tengo nada que hacer en forex (como físico), ya que necesito una comprensión clara del proceso expresado en fórmulas analíticas. Pero, aun así, a veces vengo al foro con algunos resultados teóricos. Ahora es como un hobby para mí - no bebo vodka en mi tiempo libre, de verdad:))))

¡¡¡Si el mercado tuviera una fórmula no sería el mercado!!! Se trata de una oferta y una demanda triviales. Si quieres fórmulas, lee sobre modelos de precios. Pero no son más que formas de limitar el riesgo.

Y quién sabe, tal vez sea mejor tomarse un trago de vodka que romperse la cabeza con números incomprensibles.

 
Alexander_K:

Esto es lo que estaba pensando.

Si la afirmación de que el sesgo no paramétrico de la distribución de Forex es invariable e igual a +-0,185 es cierta, puede significar (sin misticismo:)))) sólo una cosa.

Obsérvese que para una distribución normal, su mitad (la llamadadistribución seminormal) tiene un sesgo no paramétrico = 0,36279.

En este caso tenemos unadistribución media desconocida que tiene un sesgo no paramétrico de 0,185, y si la miramos desde ambos lados veremos una distribución simétrica de tipo normal.

Preguntas de nuevo:

1. Ya que utilizas repetidamente la palabra "invariante", vuelvo a preguntar: ¿qué quieres decir con ello en este caso, para la relación k = (mediana - media)/(desviación estándar)?

2. Me interesaba saber qué datos se habían seleccionado para el análisis. Mi opinión es que los pasos ascendentes se analizaron por separado de los descendentes, ya que, de lo contrario, tanto la mediana como la media de las muestras de 10.000 o más serían cientos de veces menores que la desviación estándar, y el módulo k=0,185 no se encontraría en ninguna parte. ¿Es esto cierto?

3. Si es así, ¿cómo puede ser la mediana menor que la media en presencia de colas pesadas (valores atípicos)? https://ru.wikipedia.org/wiki/%D0%9C%D0%B5%D0%B4%D0%B8%D0%B0%D0%BD%D0%B0_(%D1%81%D1%82%D0%B0%D1%82%D0%B8%D1%81%D1%82%D0%B8%D0%BA%D0%B0):

"Supongamos que hay 19 personas pobres y un millonario en la misma habitación. Cada pobre tiene 5 dólares y el millonario 1 millón(106). El total asciende a 1.000.095 dólares. Si dividimos el dinero a partes iguales entre las 20 personas, obtenemos 50.004,75 dólares. Esta será la media aritmética de la cantidad de dinero que tenían las 20 personas de la sala.

En este caso, la mediana sería de 5 dólares (la semisuma del décimo y el undécimo, los valores medios de la serie clasificada). Podemos interpretarlo de la siguiente manera. Dividiendo nuestra empresa en dos grupos iguales de 10 personas, podemos decir que todos los del primer grupo no tienen más de 5 dólares, mientras que todos los del segundo grupo no tienen menos de 5 dólares. En general, podemos decir que la mediana es lo que ingresa la persona "media". Por el contrario, la media aritmética es una característica inadecuada, ya que es significativamente mayor que la cantidad de dinero en efectivo que tiene la persona promedio".


y una petición: ¿podría por favor de acuerdo con su sugerencia https://www.mql5.com/ru/forum/218475/page14#comment_6040781

"4. No hay gráficos - las matrices se generan dinámicamente y tienen un tamaño gigantesco - sólo he guardado los resultados. En principio, los interesados pueden repetir mis experimentos en VisSim o MathLab (en este sistema - no estoy seguro, ya que no he trabajado con él)."

Publica aquí todo el millón (uno y medio) de garrapatas analizadas. Creo que Excel puede manejar el cálculo de k para un millón de líneas.

Распределение ценовых приращений
Распределение ценовых приращений
  • 2017.11.10
  • www.mql5.com
Уважаемые трейдеры...
 
Vladimir:

... Por lo tanto, al analizar los ticks no analizamos el Forex en absoluto, sino las propiedades de los algoritmos de generación de cotizaciones por esta empresa de corretaje para el par dado en el tipo de cuenta dado en el período de tiempo seleccionado. Y aquí podemos detectar muchos milagros. Por ejemplo, servir cotizaciones desordenadas (a grandes rasgos, sin filtrar) o incluso pirateadas a propósito (por ejemplo, por la "sobrerregulación") en las cuentas demo como forma de atraer a los clientes a las cuentas reales. O esos signos de que una empresa es "joven" cuando permite muchos arbitrajes (lo que probablemente hayas notado cuando hablabas de 7 sigma outliers) ya en cuentas reales.

¡Buen punto! Por cierto, también es un problema solucionable. Basta con tomar varias empresas de corretaje y comparar la distribución de los ticks para el mismo par de divisas. Si son diferentes, entonces el chamanismo tiene lugar...
 
Dennis Kirichenko:
¡Buen punto! Por cierto, también es un problema solucionable. Basta con tomar varias empresas de corretaje y comparar las distribuciones de ticks para el mismo par de divisas. Si son diferentes, significa que el chamanismo tiene lugar...
Estoy de acuerdo. Se necesitan filtros sencillos. Vuelve a comprobarlo. Toma la media entre dos ticks consecutivos. La distribución se vuelve más comprimida y "suave", es decir, el factor de escala cambia - se vuelve más conveniente para trabajar, y la invariabilidad no cambia. ¡Y esto es bueno!
 

En resumen, todavía no he podido encontrarskew=0,185. Lo he comprobado en los ticks de oferta del EURUSD. ¿Tal vez porque también había ceros? Los tomé sin y obtuve algo así como 0,3.

 

Sí, de hecho es en lo que estoy trabajando en este momento.

Si tratamos con una única distribución, que "por término medio" está presente en todos los TF, es decir, en cualquier tamaño de muestra, el algoritmo para resolver el problema en la primera aproximación es el siguiente:

1. Se calcula la varianza media a lo largo de un gran periodo de tiempo para un determinado volumen de muestra. La varianza en este caso cambia al pasar de una muestra a otra, es decir, no es invariable y es su valor medio el que hay que conocer.

2. Las líneas de soporte/resistencia se trazan frente a una media móvil ponderada (donde el peso es el valor de la densidad de probabilidad para un valor determinado del incremento) para un tamaño de muestra determinado, teniendo en cuenta la varianza media calculada y los cuantiles de la distribución t2. Esto es lo básico necesario que describe el efecto de "memoria" de un proceso no Markoviano.

3. Cuando el precio sobrepasa estas líneas, se analizan aquellos coeficientes que son invariables en la media, pero que en esta fase tienen un valor diferente al de referencia.

Por ejemplo, si el sesgo no paramétrico es ahora =0,4, al compararlo con 0,185 llegamos a la conclusión de que la distribución está muy sesgada y el precio debe volver a la media ponderada: hacemos un trato contra la tendencia. Y viceversa.

Sin embargo, supongo que un coeficiente invariante no es suficiente, debemos encontrar al menos uno más...

 
Dennis Kirichenko:

Hasta ahora no he podido encontrarskew=0,185. Lo he comprobado en los ticks de oferta del EURUSD. ¿Tal vez porque también había ceros? Los tomé sin y obtuve algo así como 0,3.

¡Bien hecho, Denis! ¿Qué has utilizado? ¿En Matlab? ¿El 0,3 sigue siendo el mismo para todas las muestras?
 
Alexander_K:

1. Para un tamaño de muestra determinado, se calcula la varianza media a lo largo de un gran periodo de tiempo. La varianza en este caso cambia al pasar de una muestra a otra, es decir, no es invariable y es la media la que hay que conocer.

2. Las líneas de soporte/resistencia se trazan frente a una media móvil ponderada (donde el peso es el valor de la densidad de probabilidad para un valor determinado del incremento) para un tamaño de muestra determinado, teniendo en cuenta la varianza media calculada y los cuantiles de la distribución t2. Esto es lo básico necesario que describe el efecto de "memoria" de un proceso no Markoviano.

3. Cuando el precio sobrepasa estas líneas, se analizan los coeficientes que son invariables en la media, pero que tienen un valor diferente al de referencia en esta fase.

Por ejemplo, si el sesgo no paramétrico es ahora =0,4, al compararlo con 0,185 llegamos a la conclusión de que la distribución está muy sesgada y el precio debe volver a la media ponderada: hacemos un trato contra la tendencia. Y viceversa.

¿No volvemos a algún parámetro que hay que optimizar, en nuestro caso "un determinado volumen de muestra"? Y esto trae consigo todos los "encantos" de la optimización, nivelando el enfoque probabilístico.

 
Stanislav Korotky:

¿No lleva esto de nuevo a algún parámetro que deba optimizarse, en este caso "un tamaño de muestra concreto"? Y esto arrastra consigo todos los "encantos" de la optimización, nivelando el enfoque probabilístico.

En la actualidad, el panorama es el siguiente: los puntos de entrada en una operación tienen éxito cuando el tamaño de la muestra "cubre" la mayoría de los valores de la distribución t2, es decir, a partir de 1000. Pero los puntos de salida no. De algún modo, dependen de otros parámetros, es decir, no se puede decir que el precio vaya a alcanzar necesariamente la media móvil ponderada cuando se negocia en contra de las tendencias. A veces sólo faltan 100 ticks, y el precio empieza a moverse hacia arriba, sin alcanzar la media móvil. Algo en lo que pensar. Pero para los puntos de salida, tienes razón, hay que optimizar el volumen de la muestra...
Razón de la queja: