Filtros digitales adaptativos - página 8

 
Mathemat:
2 Prival: He recordado que Kalman, según tú, se basa en MNC. Ahora entiendo por qué funciona muy bien con los datos del radar (con errores distribuidos gaussianos), pero - peor con los datos del mercado. La razón principal por la que Kalman es perfecto en datos gaussianos es que la función de error (objetivo) -la suma de cuadrados de la varianza en este caso- es perfecta sólo para la distribución gaussiana. Para otras distribuciones, las funciones de error son diferentes. En el caso de las distribuciones con colas potentes (pesadas), las funciones objetivo son bastante diferentes, y la MNC no cuenta aquí. Por eso JMA es mejor que Kalman en las series de mercado.

Qué interesante. Vamos Alexey, yo también agitaré mi abedul sobre tu cabeza :-). Al fin y al cabo, el 99% de las disputas surgen cuando una persona dice que es mejor. Pero no ha dicho en qué sentido es mejor (dónde está el criterio + cuánto es mejor). Y digamos que sostengo que MA es aún mejor, el mejor, simplemente increíblemente mejor :-). JMA y Kalman no están ni siquiera cerca.

Es como decir que una persona es mejor que otra. Pero no decir de qué manera (sin criterio). Supongamos que el primero es mejor bebiendo vodka, mientras que el segundo es mejor disparando a los pioneros con una honda. La pregunta es ¿cuál de ellos es mejor?

Después de todo JMA es una caja negra para ti y para mí. Y el filtro Kalman debe contener

1. Un modelo de observación (modelo de señal + modelo de ruido).

2. Un modelo de medición (modelo de error de medición).

Y la solución a encontrar por ANC con una función de pérdida cuadrática. Basado en datos a priori y en las mediciones obtenidas. Y quiero señalar que dicha función de error objetivo funciona no sólo para Gauss, sino para cualquier ley de distribución simétrica.

Matemáticas y ahora una pregunta. Supongamos que el proceso analizado es sinusoidal con ruido uniforme y las mediciones están sujetas a una ley de Poisson no estacionaria. Todos estos modelos están anidados en el filtro de Kalman y éste ha encontrado la estimación óptima (de esta mezcla salvaje) a la llegada de una nueva medición por CNA (función de pérdida cuadrática) según todos los datos a priori anidados en él.

¿Dónde, en qué lugar está mejor la caja negra de la JMA?

Si a un filtro Kalman le pones un modelo 100% consistente con forex (señal + ruido) y un modelo de medición adecuado (sistema de estimación experto no sincrónico), será una máquina cojonuda.

Z.U. El modelo de ruido de observación y medición puede ser cualquiera. Lo principal es ser coherente con lo que hay.

 

Convencido, privado. Así que hay algo que Djuric obviamente no nos está diciendo, o está haciendo alarde deliberadamente de su producto. Y sin embargo, y sin embargo: ¿por qué el OLS y no, digamos, la suma de los módulos de las desviaciones? ¿Simplemente porque el CNA es analíticamente más conveniente?

P.D. Recuerdo haberme preguntado por una función de pérdida expeditiva en relación con mi antigua investigación sobre redes neuronales (allí es una función objetivo). Y de alguna manera dedujo o leyó en alguna parte que la suma de los cuadrados está directamente relacionada con la hipótesis particular sobre la ley de la distribución del error (aquí - gaussiana). Cuando en mi investigación cambié la función a suma de módulos (es decir, cambiando la ley a priori de la distribución del error a exponencial), la calidad de la predicción mejoró ligeramente, pero no de forma cardinal.

 
Prival:

Si pones un modelo en el filtro Kalman que sea 100% consistente con forex (señal + ruido) y un modelo de medición adecuado (sistema de juicio experto no sincrónico), será una máquina infernal.

Z.U. El modelo de ruido de observación y medición puede ser cualquiera. Lo principal es hacer coincidir lo que hay.


¿El modelo de la señal en sí tiene alguna limitación?
 
grasn:

a Northwind.

Gracias. Y "necesitamos un concepto simple y suficientemente consistente de la vida del mercado", ¿se refiere a su propio desarrollo o al uso de algunas técnicas, como las descritas por Shiryaev?


Todo por mi cuenta, basado en lo que he visto y leído.
 
Mathemat:

...la suma de los cuadrados está directamente relacionada con la hipótesis particular sobre la ley de distribución del error (aquí, gaussiana)...

Si mi memoria no me falla, sí.
 

Prival, Mathemat, tengo miedo de volver a enfadarme, pero tengo que volver a decirlo: prácticamente no hay ruido en las comillas, es la señal de entrada. Se trata de utilizar las herramientas de la estadística matemática (el filtrado es lo mismo). ¿Estadísticas de qué? La estadística, las leyes de distribución, sus momentos de diferentes órdenes se refieren a variables aleatorias (procesos). Si se produce un tic, ¿es una señal o un ruido? Yo sostengo que es una señal, porque con estos datos se puede dar una orden de compra o de venta, y se ejecutará (en igualdad de condiciones generales). Sí, es difícil predecir cuál será el próximo valor del precio, por lo que quiero creer que hay un componente aleatorio y otro no aleatorio que se puede detectar y luego extrapolar-predecir. Y no es aleatorio, es simplemente desconocido. O, si se quiere, todo al azar, sin dividirlo en componentes aditivos. ¿Qué vas a separar? El mismo filtro de Kalman filtrará una componente muy definida, definida por su propio modelo en forma de función analítica suave. ¿Lo conoces? No lo sé. Estás tratando de identificar las propiedades dinámicas del mercado, y aplicar una analogía física me temo que también es inútil: puedes encontrar velas diminutas con una amplitud superior a una cifra, así como huecos, lo que indica que prácticamente no tiene inercia.

Es posible, aceptando la hipótesis de que los valores de los precios son aleatorios, investigarlos utilizando la estadística matemática. Esto es algo a lo que Mathemat y otros son aficionados desde hace tiempo. El resultado son colas gordas y, por tanto, de nuevo la falta de perspectivas prácticas.

Pero, ¡qué decir de los resultados positivos de los "pianistas" y de los dirigentes de los campeonatos! Son ellos los que hablan de la necesidad de ampliar el paradigma metodológico. Deberían introducirse en el SCM elementos de análisis técnico (y tal vez incluso fundamental), pero no directamente, utilizando las antiguas recetas "clásicas", sino a través del filtrado previo de modelos de trabajo sobre la base del enfoque bayesiano. Es difícil hacer frente a tal cantidad de información "manualmente", pero alguien lo hace. La conclusión es obvia: entrenar a un robot.

Ya he hecho una red probabilística en MQL pero no puedo hacerla funcionar con un factor de beneficio superior a 1,5 - el profesor es demasiado débil :-).
P.D. Otro ejemplo para confirmar el argumento sobre la ausencia de ruido en el precio.
Cuando se habla de ruido de las mediciones se refiere a una desviación aleatoria de los datos de las mediciones con respecto al valor real de la cantidad que se mide. Por ejemplo, el radar (para especialistas :-)) dio un valor de rango 105, y el valor verdadero es 100, en la siguiente medición 99 en lugar de 101 y así sucesivamente. La distribución del error es generalmente normal. En el caso de que el precio llegue, por ejemplo, a 1,2567 -éste es su valor real, ¡el error es igual a cero! ¿De qué tipo de ruido estamos hablando?

 
rsi:

Prival, Mathemat, tengo miedo de volver a enfadarme, pero tengo que volver a decirlo: prácticamente no hay ruido en las comillas, esa es la entrada.

No hay molestias, rsi, discusión normal. En general, estoy de acuerdo contigo: el ruido entre comillas sólo puede verse dentro de una determinada interpretación, un modelo. Cuando hablo de errores, suelo hablar de errores de predicción o de aproximación.

Prival se refiere a los errores de observación y medición. Esto es bastante natural en términos de su especialidad. Pero son errores muy diferentes. Sin embargo, este punto de vista tiene derecho a la vida, aunque en mi opinión es artificial. Prival, no te ofendas, pero cómo pretendes implementar en la práctica tu tasa de muestreo de 100 MHz, aún no tengo ni idea.

Considero que la aplicación de métodos estadísticos al tratamiento de las series financieras sólo es útil en el contexto de la evaluación de posibles riesgos, no más que eso.

...se pueden encontrar velas diminutas con una amplitud superior a una cifra, así como huecos, lo que demuestra su práctica ausencia de inercia.

Sí, y también hay una vela de cinco minutos en el oire de 198 pips en el año 2000. ¿quién es más grande?

 
rsi:

Prival, Mathemat, tengo miedo de volver a molestarme, pero tengo que volver a decirlo: casi no hay ruido en las comillas, es la señal de entrada.


Rsi, al contrario, me alegro mucho de que hayas vuelto a la discusión. Al fin y al cabo, lo que dices tiene sentido, me hace pensar. Pido disculpas por mí y por los demás, si he dicho (o han dicho) algo incorrecto. Yo tenía un matemático que me daba esas órdenes (los generales se relajan :-)), me hacía hacer flexiones :-). Lo veré vivo, lo abrazaré como a un hermano. Y tú para mí un pantalón amarillo, ns en MT4, mago. Al igual que klot.

Sobre el ruido, yo también lo pienso todo el tiempo. Hice lo siguiente. Tomé las cotizaciones semanales y comencé a analizar todos los componentes de este flujo. Primero resté la tendencia, luego las fluctuaciones, todo lo que pude sacar. Y después de cada procedimiento, miraba los residuos. Cuando seleccioné todos ellos, había ruido en los residuos, pero no ruido gaussiano. Algún ruido extraño +-1 pip y nada más, algunos picos raros de 2-5 pips y 1 gap fue de 40 pips (buscaba especialmente una semana con buen gap). Me senté a pensar en ello y creo que encontré una explicación para este ruido. Lo más probable es que sea un ruido de medición, si se miran las cotizaciones desde el punto de vista del ADC (es ruido de cuantificación y muestreo) deberían estar físicamente ahí si digitalizamos un proceso continuo. Así que creo que puedes tener razón en que no hay ruido allí - es una señal pura. Pero hay un matiz que me molesta :-(.

Es bastante natural desde el punto de vista de su especialidad. Pero se trata de errores muy diferentes. Sin embargo, este punto de vista tiene derecho a la vida, aunque, en mi opinión, es artificial. Prival, no te ofendas, pero cómo vas a implementar en la práctica tu tasa de muestreo de 100MHz, no tengo ni idea todavía.

No hay manera de hacer 100MHz no es posible (de lo contrario ya estaría en el punto dulce :-)). La única manera de mejorar esta situación, al menos un poco, es hacer lo que hacen en un DC normal. Tenemos que tomar el máximo número de proveedores de cotizaciones y procesar este flujo por nosotros mismos (y no construir una vela, sino una elipse de probabilidad constante). Al fin y al cabo, hay que concluir las operaciones (de compra y de venta) de acuerdo con los datos facilitados por las empresas de corretaje. Pero no tenemos que utilizar sólo los datos de esta empresa de corretaje para tomar una decisión de compra o venta; podemos no utilizar las cotizaciones en absoluto :-)

Por la cantidad de módulos de desviación. Si no me equivoco, con este enfoque la valoración es sesgada o insostenible. No recuerdo exactamente, tengo miedo de equivocarme, pero algo sobre el poder de la estimación. Aunque puedes elegir uno no cuadrático. Básicamente cualquiera, lo principal es determinar en qué dirección desde el centro (el observador ideal) los errores son más importantes, digamos que en una dirección es un cuadrado en la otra un cubo. Esto es de la teoría estadística de la toma de decisiones. (El libro de Wald "Statistical Decisive Rules", creo que está ahí). Si alguien necesita un libro puedo publicarlo.

NorthernWind

No entiendo las limitaciones que me plantea, por favor aclare la pregunta.

El modelo debe representarse en forma de un sistema de ecuaciones diferenciales estocásticas. Y la condición principal es que debe ser adecuada al proceso que se filtra. Éstas son exactamente las limitaciones que tenemos.

Z.I. Mathemat quería ofenderme :-), no puedes esperar. Aquellos a quienes respeto, simplemente no pueden hacerlo. A no ser que me dé la mano y tire el coñac (tan larga y cuidadosamente conservado para él), y entonces pensaré primero que tal vez he hecho algo mal. Y entonces seré yo quien lleve el agua :-)

 
rsi:
El mismo filtro de Kalman filtrará un componente bien definido - definido por su propio modelo como una función analítica suave. ¿Lo conoces? No lo sé. Estás tratando de identificar las propiedades dinámicas del mercado, y aplicar una analogía física es, me temo, también inútil: puedes encontrar velas diminutas con una amplitud mayor que una cifra, así como huecos, lo que indica su naturaleza prácticamente sin inercia.

Estoy de acuerdo en que las cosas están mal en los puntos de separación y quizás no hay inercia. Y no hay manera de deshacerse de todas las lagunas (he planteado la hipótesis de que se debe a la discrepancia de la tasa de muestreo con el proceso analizado - no parece contradecir nada). Pero las lagunas no son las 24 horas del día. El análisis ACF muestra que el proceso está correlacionado, que existe un tiempo de correlación y que, por tanto, el proceso puede predecirse. Al fin y al cabo, es una analogía casi directa con un proceso físico, un avión no puede girar instantáneamente, la masa interfiere, hay inercia, el proceso se puede predecir porque está correlacionado. Sin esto y NS no funcionaría IHMO (he leído aquí que este acrónimo se puede interpretar de diferentes maneras, tengo esto en mi humilde opinión).

¡Pero qué decir de los resultados positivos de los "pianistas" y de los líderes del Campeonato! Eso es exactamente lo que dicen sobre la necesidad de ampliar el paradigma metodológico. Deberían introducirse en el MTS elementos de análisis técnico (y quizá incluso fundamental), pero no directamente y con las viejas recetas "clásicas", sino con un filtrado previo de modelos de trabajo basados en el enfoque bayesiano. Es difícil hacer frente a tal cantidad de información "manualmente", pero alguien lo hace. La conclusión es entrenar a un robot.

Los resultados son alentadores y mantienen mis manos en alto (los economistas hablan de martingalas y del proceso de Wiener). No sé si estoy siguiendo la vieja receta "clásica" (aunque he leído libros sobre análisis de divisas, no todos, pero hay decenas de buenos). He buscado tanto como he podido que no he encontrado los resultados de aplicar el filtro de Kalman al análisis de las cotizaciones. O bien están ausentes o, por el contrario, los que consiguieron aplicarla ocultan cuidadosamente sus resultados. Para ello es muy importante seleccionar los modelos de trabajo mediante el método bayesiano. De lo contrario, no funcionará. Intento hacerlo manualmente, es difícil, pero es muy interesante. No me fío de los algoritmos, donde no sé cómo se toman las decisiones. No me gustan.

El filtro de Kalman rara vez consigue aplicarse en la vida real. Se puede considerar un ideal, como la conocida solución bayesiana, cuando se elige la estimación más potente en presencia de información a priori y a posteriori.

Es así.

 
Prival:
Había algo de ruido en los residuos, pero no era gaussiano. Ruido extraño de +-1 pip y nada más, algunos picos raros de 2-5 pips más 1 gap fue de 40 pips (estaba buscando una semana con un buen gap).

Y yo, Mathemat y alguien más vimos este ruido en las garrapatas. Además, en los ticks está claro que los puntos +-1 tienen mayor probabilidad de que se produzca el movimiento inverso que su continuación. Desgraciadamente, esta regularidad está dentro del spread. Y no es alto.

Pero el hecho de que haya aparecido después del procesamiento es interesante.

Razón de la queja: