Estadística de la dependencia entre comillas (teoría de la información, correlación y otros métodos de selección de características) - página 30

 
faa1947:

análisis de residuos para la autocorrelación y el tipo de función de densidad de probabilidad. También, por supuesto, R^2. Se trata, en principio, de técnicas habituales de predicción de series temporales.

Esto es sólo un comienzo, y en el sentido de ser generalmente aceptado, no está completo. Aquí se muestra completo, aunque sólo es un ejemplo de uso. Tres grupos de análisis: coeficientes, residuos y estabilidad. Si puedes conciliar las contradicciones, puedes obtener una estimación, que siempre es un error de predicción, ya que el objetivo es la predicción y todo lo demás son los resultados intermedios.

Sí, creo que nunca he hecho un estudio académico completo. Suele faltar tiempo y esfuerzo en el trabajo, así que voy por el camino más corto: construir varios (2 o más) modelos predictivos y hacer un análisis de residuos, y luego elegir un modelo basado en una evaluación equilibrada de la precisión y la calidad de las series de residuos. Estoy de acuerdo en que, si se dispone de tiempo, se puede profundizar en las estimaciones de fiabilidad de los predictores.

Por cierto, una prueba buena y relativamente barata de la precisión y la estabilidad de los predictores es la validación cruzada, en la que los períodos de entrenamiento y validación se eligen muchas veces, de modo que finalmente toda la serie original se divide en pequeños segmentos y cada segmento se incluye en la muestra de validación.

 
alexeymosc:

Sí, creo que nunca he hecho un estudio académico completo. Por lo general, en mi trabajo hay escasez de tiempo y esfuerzo, así que tomo un camino más corto: construyo varios (2 o más) modelos predictivos y hago un análisis de los residuos, luego elijo un modelo basado en una estimación equilibrada de la precisión y la calidad de las series de residuos. Estoy de acuerdo en que, si se dispone de tiempo, se puede profundizar en las estimaciones de fiabilidad de los predictores.

Por cierto, una prueba buena y relativamente barata para comprobar la precisión y la estabilidad de los predictores es la validación cruzada, en la que los periodos de entrenamiento y validación se eligen muchas veces, de modo que finalmente toda la serie original se divide en pequeños segmentos y cada segmento se incluye en la muestra de validación.

Desde hace mucho tiempo, doy el siguiente consejo, que se ha ganado a pulso por mi propia experiencia. Desde hace unos treinta años, y sobre todo hoy en día, la forma más productiva de dominar una materia es cursar un paquete preparado centrado en esa materia. He mencionado EViews, pero no es el único paquete. Es que este paquete se utiliza en la enseñanza en nuestras universidades. Utilizando el paquete ganará:

Un gran número de programas especializados funcionales y validados por millones de usuarios

esquema de análisis

exhaustividad del análisis

referencias de las que se tomaron los algoritmos utilizados.

Una vez adquirida la experiencia y la perspectiva, puedes pasar a algunas mejoras. Pero estas mejoras se basarán en el conocimiento sistemático de la materia y no se le ocurrirá traer a Peters o a algún otro como Ptolomeo, como algunos de arriba.

 
faa1947:

Desde hace mucho tiempo, doy los siguientes consejos, ganados a pulso por mi propia experiencia. Desde hace unos treinta años, y sobre todo hoy en día, la forma más productiva de aprender una materia es cursar un paquete preparado centrado en esa materia. He mencionado EViews, pero no es el único paquete. Es que este paquete se utiliza en la enseñanza en nuestras universidades. Usando el paquete se obtiene:

un gran número de programas especializados funcionales y probados para millones de usuarios

Un marco de análisis

Exhaustividad del análisis

Listas de referencias de las que se han extraído los algoritmos utilizados.

Una vez adquirida la experiencia y la perspectiva, puede pasar a realizar cualquier mejora. Pero estas mejoras se basarán en un conocimiento sistemático de la materia y no se le ocurrirá traer a Peters o a alguien como Ptolomeo, como algunos de arriba.


Lo siento, pero lo principal es el planteamiento correcto del problema y las conclusiones. Por ejemplo, lo que está escrito en el artículo relativo al "Diagnóstico de los indicadores" y las conclusiones sobre la base de los residuos que el indicador es útil o no, etc. - no es correcto (imha). Al igual que no es cierto que el indicador tenga que predecir o ser útil en absoluto en toda la serie. No es necesario prever los precios todo el tiempo para obtener beneficios, sólo en momentos relativamente raros. Predicción en cierto sentido, porque no se trata de un único cambio de precios, sino de la solidez del sistema y la repetición de estadísticas pasadas. Y no son los indicadores los que hacen predicciones, sino el sistema en su conjunto.

P.D. El artículo sigue siendo útil, gracias :)

 
Avals:


Por ejemplo, lo que has escrito en el artículo en relación con el "diagnóstico de indicadores" y las conclusiones basadas en los residuos de que el indicador es útil o no, etc. - no es correcto (imha). Tampoco es cierto que el indicador deba predecir o ser útil en todo el rango.

Estoy de acuerdo, el artículo fue escrito con algunas dudas, porque su propósito era demostrar el enfoque en general, la metodología en su totalidad, por así decirlo.

No es necesario hacer previsiones de precios todo el tiempo para obtener beneficios, sólo en momentos relativamente raros

No estoy en absoluto de acuerdo. Cualquier TS siempre predice, lo admita o no. Con la periodicidad se hace un análisis para tomar decisiones para el futuro: tomar una posición, salir, mantenerse fuera del mercado o permanecer en él. Estas decisiones se basan en las previsiones del comportamiento futuro del mercado.

Lo que se predice no es un único cambio de precios, sino la solidez del sistema.

La robustez no se predice, se construye, mientras que el resultado de la construcción se evalúa mediante el error de previsión: si la varianza del error se acerca a una constante, el sistema será estable.

Y no son los indicadores los que predicen, sino el sistema en su conjunto.

Naturalmente. El artículo parte de la base de que el sistema consta de un único indicador. Incluso con esta simplificación, el artículo se ha complicado demasiado.

Si quieres discutir el artículo en detalle, te sugiero que te muevas al tema apropiado, tal vez otros se unan. Después de todo, este hilo tiene un tema diferente.

 
faa1947:

No es necesario prever constantemente los precios para obtener beneficios, sólo en ocasiones relativamente raras

Totalmente en desacuerdo. Cualquier TS siempre predice, lo admita o no. Con la periodicidad del TS se realiza un análisis para tomar decisiones de cara al futuro: tomar una posición, salir, mantenerse fuera del mercado o dentro del mercado. Estas decisiones se basan en predicciones del comportamiento futuro del mercado.


no hay necesidad de predecir, sino de predecir continuamente :) Sólo en momentos discretos, y comprobando los residuos del indicador en toda la serie se comprueba realmente su capacidad para predecir la serie de forma continua
faa1947:

No se prevé un único cambio de precios, sino la solidez del sistema

La robustez no se predice, sino que se construye, y el resultado de la construcción se evalúa mediante el error de predicción: si la varianza del error se acerca a una constante, el sistema será estable.

Los resultados de una operación individual no son importantes, lo importante son las estadísticas de muchas operaciones. Debe corresponder, al menos parcialmente, a las estadísticas favorables de las pruebas retrospectivas. Por lo tanto, cuando se da dinero a la gestión del sistema, se apuesta exactamente por esto: que nuestras estadísticas favorables se mantengan (con un enfoque sistemático). Y eso es robustez
 
alexeymosc:

Es posible que lo sea. Pero cuando construimos una serie de retornos de la siguiente forma: X[t]-X[t-1], casi no lo muestra. Utilizo las palabras rendimientos, incrementos, retornos, todas ellas son series de precios diferenciadas.

Esto es fácilmente verificable, no hace falta que haya argumentos filológicos :). Por cierto, puedes intentar informarte en este foro.

La inclinación de la probabilidad en la dirección del cambio de signo es mínima e insignificante. Pero si se calcula la entropía condicional entre la variable dependiente y los rendimientos a lo largo de dos o más rezagos, entonces toda la desigualdad se contabiliza en la cifra resultante, de modo que la entropía se reduce.

Una vez más: la fuerza del efecto depende del TF, pero ¿el H1 generado en ticks aleatorios será similar al H1 generado en ticks con rendimiento real?

Intenté entrenar NS con datos horarios y tomé sólo los rezagos más informativos (42 variables, en los rezagos 1, 2, 23, 23, 25,... 479, 480, 481). Por desgracia, el resultado no fue muy bueno. Precisión de la predicción del número cuantil - en la región del 30-40%. Aunque, las irregularidades que la red neuronal fue capaz de traducir a la salida, pero las dependencias no son suficientes para la predicción. Todo el problema es que las variables independientes son mutuamente informativas en los lag 1, 2, 24.... y la cantidad total de información sobre la barra de cero es realmente pequeña. Deberíamos pensar como opción en tomar plazos diarios y más antiguos.


Supuse desde el principio que la técnica detectaba todas las dependencias, tanto las útiles como las inútiles para la previsión. En cuanto a la volatilidad, hay pruebas definitivas que apoyan esta suposición. Es decir, esos rezagos "informativos" suyos pueden estar simplemente atascados con este tipo de información inútil para la predicción.

Creo que mi tiempo en este hilo ha terminado o no ha llegado todavía :). Probablemente es hora de que la fuente se tome un descanso :).

 
Candid:


He asumido desde el principio que la metodología detecta cualquier dependencia, tanto las que son adecuadas para la predicción como las que son inútiles. En cuanto a la volatilidad, hay algunas pruebas que apoyan esta suposición. Es decir, esos rezagos "informativos" suyos pueden estar simplemente obstruidos con este tipo de información inútil para la predicción.

Yo también me he dado cuenta muy bien. El problema se ha complicado hasta el nivel de encontrar signos informativos de una señal de cambio de precios. Y si resulta que en los marcos temporales intradiarios los rezagos informativos necesarios son cíclicos (sospecho que lo son), entonces su información total sobre la dirección del movimiento del precio en la barra cero será muy pequeña...

Esto lo comprobaré. Lo siguiente será: intentar investigar las barras diarias y, probablemente, las semanas pueden seguir siendo estadísticamente fiables. Pero si los rezagos informativos también son cíclicos allí, por desgracia, creo que la idea de usar sólo rezagos no funcionará. Entonces puedes probar los indicadores.

Lo había planeado así desde el principio, por cierto. Pero hasta que no lo pruebe, la fuente no desaparecerá.

"Así que estos rezagos "informativos" suyos podrían estar atascados con este tipo de información inútil para la predicción".

¿Y qué quiere decir con "información inútil"? Bien, la volatilidad no es nuestra amiga. También hay componentes de ruido. Creo que has decidido desde el principio desechar el método. Hay que saber utilizar cualquier herramienta, yo todavía estoy aprendiendo, por eso aquí hay más agua que calorías.

Ya lo he sugerido: publica cualquier indicador y el objetivo que indica. Una de las condiciones es que se ajuste a las fórmulas de Echel y que exista la posibilidad de jugar con sus parámetros. El objetivo también debe ser específico, por ejemplo, el precio bajará en un máximo de 6 barras, o el precio superará el precio actual en 10 puntos. Voy a analizar los datos y te daré un conjunto de parámetros óptimos del indicador en términos de entropía de la información.

 
Avals:
En realidad, debería coincidir, al menos parcialmente, con las estadísticas de las pruebas de resistencia que nos son favorables.
Esperar que sea "favorable" o tener una expresión numérica para este "favorable". Más arriba he nombrado uno de los valores estimados: la variación de la varianza del error de predicción no debe superar el 5%. Pero este no es el único requisito para un sistema robusto. Y la prueba de espalda sólo da esperanzas de que no cambie.
 
faa1947:
Esperar que sea "favorable" o tener una expresión numérica para ese "favorable". Más arriba he nombrado uno de los valores calculados: la variación del error de previsión no debe superar el 5%. Pero este no es el único requisito para un sistema robusto. Y la prueba de espalda sólo da esperanzas de que no cambie.


Sí, existen métodos para evaluar la solidez.

Aplicado al tema y a tu artículo: la forma de llevar toda la serie de precios a una forma estacionaria con MO positiva es crear un sistema de inversión rentable y robusto que esté siempre en el mercado. Esto también se aplica a la forma de distinguir una serie real de un vagabundeo aleatorio. Ese es, de hecho, el indicador que pasará sus pruebas y el criterio que distinguirá la serie real de la SB es el algoritmo de este sistema. Por lo tanto, es ingenuo creer que un indicador tomado al azar o el método de información mutua es un algoritmo de este tipo para las cotizaciones del mercado. Sólo puede ocurrir por pura casualidad.

 
faa1947:

La teoría del mercado eficiente no se tiene en cuenta en la econometría. Todos sus supuestos se basan en que el mercado no es eficiente. La econometría no incluye a Markowitz y sus apologistas y sus carteras eficientes. La econometría existe desde hace más de 100 años y nunca ha sido refutada por Peters, Mandelbrot y otros, ya que se basa originalmente en el supuesto de que el mercado no es estacionario.

Es la econometría la que justifica una previsión un paso adelante y muestra las razones del fatal deterioro de la previsión varios pasos adelante.


el problema es que los indicadores macro pueden cambiar periódicamente su ponderación, etc...+ el corto periodo de tiempo disponible para el análisis completo...

Estoy de acuerdo, por supuesto, en que la fase debe estar presente en el análisis...

Razón de la queja: