Discusión sobre el artículo "Análisis de los gráficos mediante métodos econométricos" - página 7
Está perdiendo oportunidades comerciales:
- Aplicaciones de trading gratuitas
- 8 000+ señales para copiar
- Noticias económicas para analizar los mercados financieros
Registro
Entrada
Usted acepta la política del sitio web y las condiciones de uso
Si no tiene cuenta de usuario, regístrese
Bravo. Gran post, toca muchos temas. Pero algunos puntos son criticables. Por ejemplo, uno de ellos: ¿en qué te basas para decidir que hay que eliminar los valores atípicos? No se pueden eliminar.
Un valor atípico no es un valor atípico. Hay que fijarse en las citas. Si un valor atípico es relativamente raro, debe recortarse hasta el umbral (no eliminarse). Si no lo es, no está claro qué hacer. En principio, los valores atípicos distorsionan mucho las estadísticas. Cualquier paquete estadístico tiene en cuenta esta posibilidad y ofrece recomendaciones adecuadas.
Por lo que yo sé, los valores atípicos se eliminan en las mediciones cuando se sabe de antemano que los resultados están unidos por al menos alguna ley, es decir, en otras palabras, cuando el proceso que genera el valor medido es no aleatorio o estacionario aleatorio, y el valor atípico puede deberse a la aleatoriedad (sobrepasar los límites de la no aleatoriedad o estacionariedad), y dicha aleatoriedad en este caso es una distorsión. Si se trata de una serie de precios, no estacionaria, entonces la aleatoriedad de cualquier nivel es una parte de la estadística (además de la parte no aleatoria, pero es difícil separarlas), y la eliminación de una parte de la estadística, respectivamente, es una distorsión de la estadística. Yo estoy más cerca de la idea de que cuando se trabaja con un proceso aleatorio no estacionario no tenemos derecho a eliminar (cortar) algo. Por cierto, no has respondido cuál crees que es el objetivo último de, por ejemplo, el recorte. Probablemente los paquetes estadísticos están orientados a trabajar con series estacionarias, y las recomendaciones de recortar valores anómalos son válidas en este caso.
Si no es así, no está claro qué hacer.
Por lo que yo sé, los valores atípicos se eliminan al hacer mediciones cuando se sabe de antemano que los resultados están unidos por al menos alguna ley, es decir, en otras palabras, cuando el proceso que genera el valor medido es no aleatorio o estacionario aleatorio, y el valor atípico puede ser causado por la aleatoriedad (superando los límites de la no aleatoriedad o estacionariedad), y tal aleatoriedad en este caso es una distorsión. Si se trata de una serie de precios, no estacionaria, entonces la aleatoriedad de cualquier nivel es una parte de la estadística (además de la parte no aleatoria, pero es difícil separarlas), y la eliminación de una parte de la estadística, respectivamente, es una distorsión de la estadística. Yo estoy más cerca de la idea de que cuando se trabaja con un proceso aleatorio no estacionario no tenemos derecho a eliminar (cortar) algo. Por cierto, no has contestado cuál crees que es el objetivo último de, por ejemplo, el recorte. Probablemente los paquetes estadísticos están orientados a trabajar con series estacionarias, y las recomendaciones de recortar los valores anómalos en este caso son válidas.
¿Qué quiere decir con eso?Incluso el modelo ARIMA trata las series no estacionarias reduciéndolas a una forma estacionaria.
Me parece que el problema del recorte de comillas tiene dos capas: superficial y profunda.
En la superficie hay problemas, por ejemplo, de derribo de stops, que no tienen nada que ver con la no estacionariedad del mercado.
El problema más profundo de la aplicación de la estadística matemática y la econometría es que tanto los datos iniciales como los resultados intermedios y las conclusiones deben comprobarse mediante métodos extramatemáticos - intuitivos. La elección del umbral de corte (2, 3, 4 sigma u otro) sólo es posible tras la observación visual del gráfico y se refiere al problema de la elección de los intervalos de confianza. El mayor problema de la aplicación de la matestadística es que su aplicación no es concebible sin el arte del propio estadístico. Nadie formulará la regla "cortar - no cortar". Si cortas - eliminas la característica de no estacionariedad, si no cortas - distorsionas la verdadera distribución de la población general por un muestreo fallido.
El corazón de la econometría es la comprobación de hipótesis, donde es posible cometer errores del primer y segundo tipo: rechazar la hipótesis nula correcta a favor de la hipótesis alternativa incorrecta, y rechazar la hipótesis alternativa correcta a favor de la hipótesis nula incorrecta.
Teniendo en cuenta lo anterior, puedo estar de acuerdo y en desacuerdo con usted al mismo tiempo. Es imposible responder a su pregunta de forma inequívoca sin considerar previamente una muestra específica.
Даже модель ARIMA работает с нестационарными рядами путем приведения их к стационарному виду.
E incluso después, los órdenes del modelo pueden cambiar con el tiempo. Conclusión - una serie de datos no estacionaria ha sido ajustada a un modelo (método) diseñado para trabajar con una serie estacionaria en algún momento. Dado que esto es así - es necesario investigar de alguna manera con qué frecuencia hacer la persecución, cuánto tiempo funciona. Sin eso - ¿cómo utilizar un modelo inadecuado?
Wt aquí creo que el razonamiento es erróneo. Una serie no estacionaria no tiene población general, sino es una serie estacionaria. Y como lo es, no hay distribución verdadera.
Sobre el derribo - ¿cómo sabes si lo fue o no? Por supuesto, si analizas los datos de varios DCs, cercanos a niveles fuertes, incluso redondos, y ves que alguno de ellos derribó el stop (para lo que hay que introducir un criterio), entonces estoy de acuerdo contigo, aparecen algunos motivos cuasi objetivos para el recorte. Pero - establecer esto es todo un trabajo, una gran investigación.
El problema más profundo de la aplicación de la estadística matemática y la econometría es que tanto los datos iniciales como los resultados intermedios y las conclusiones tienen que ser comprobados por métodos extra-matemáticos - intuitivos. La elección del umbral de corte (2, 3, 4 sigma u otro) sólo es posible tras la observación visual del gráfico y se refiere al problema de la elección de los intervalos de confianza. El mayor problema de la aplicación de la matestadística es que su aplicación no es concebible sin el arte del propio estadístico.
E incluso después, los órdenes del modelo pueden cambiar con el tiempo. Conclusión: una serie de datos no estacionaria se ajustó a un modelo (método) diseñado para trabajar con una serie estacionaria, en algún sitio.
Razonamiento estándar en AT: la serie no estacionaria es una suma de tramos estacionarios con características diferentes. Si tomamos la caja de herramientas de Matlab, esta cuestión no se considera en absoluto: se considera que la PA tiene varias diferencias respecto a la distribuida normalmente y entonces se lucha con estas desviaciones. No se tratan todas.
Dado que este es el caso - es necesario investigar de alguna manera con qué frecuencia hacer la persecución, cuánto tiempo funciona. Sin eso - ¿cómo utilizar un modelo inadecuado?
No existe tal problema. Hay dos tipos de previsión: un paso por delante (para la vela siguiente) y muchos pasos por delante.
Pero aquí creo que el razonamiento es erróneo. Una serie no estacionaria no tiene población general, de lo contrario ya es una serie estacionaria. Y como lo es, no hay distribución verdadera.
En principio no estoy de acuerdo. La estacionariedad es una característica de la serie, no del tamaño de la población.
Sobre el derribo de un tope - ¿cómo sabes si lo fue o no? Por supuesto, si analizas los datos de varios DCs, cercanos a niveles fuertes, incluso redondos, y ves que alguno de ellos tumbó el stop (para lo que hay que introducir un criterio), entonces estoy de acuerdo contigo, aparecen algunos motivos cuasi objetivos para el recorte. Pero - establecer esto es todo un trabajo, mucha investigación.
Derribar una parada es sólo un ejemplo. Cuando revisamos las cotizaciones, tenemos que decidir qué vamos a tomar como cotizaciones y qué se cae por razones que desconocemos.
Yo no lo llamaría así. El arte, o quizá sólo el grado de formación de un estadístico viene determinado por cómo es capaz de estimar los límites de aplicabilidad de los métodos orientados a trabajar con una serie estacionaria en relación con una serie no estacionaria. Pero no estimar intuitivamente, sino cuantitativamente (numéricamente).
No estoy de acuerdo. Es imposible llevar a una serie estacionaria por completo. de ahí vienen los errores en la definición de hipótesis.
¿Existe alguna base para este razonamiento? Después de todo, la serie obtenida por la suma mencionada se puede obtener sin ella - por casualidad, y se puede obtener por otra suma de otros segmentos con otras leyes. Y puesto que es así - entonces, ¿cómo ser (lo que es cierto)?
Si tomamos la caja de herramientas de Matlab, esta cuestión no se considera en absoluto: se considera que la PA tiene algunas diferencias de normalmente distribuida y más lucha con estas desviaciones.
¿En base a qué se considera esto?
Esta cuestión no existe. Hay dos tipos de previsión: un paso por delante (para la vela siguiente) y muchos pasos por delante.
¿Qué tiene que ver esto con el hecho de que un modelo con diferentes parámetros pueda ser más óptimo en los siguientes pasos?
En principio, no estoy de acuerdo. La estacionariedad es una característica de la serie, no del tamaño de la población.
No está claro - ¿puede describir con más detalle lo que quiere decir? Una distribución verdadera caracteriza las propiedades de una serie, pero una distribución no estacionaria es, por definición, aquella en la que éstas cambian. Por lo tanto, no existe una verdadera que pertenezca a la población general. La R.N. sólo tiene una verdadera, y en un momento dado del tiempo, y para un número finito de velas.
Derribar un stop es sólo un ejemplo. Al revisar las cotizaciones, tenemos que decidir qué vamos a tomar como tal, y qué se cae por razones que desconocemos.
¿Y en qué te basas para decidir algo si las razones son desconocidas?
No estoy de acuerdo. Es completamente imposible reducir a una serie estacionaria. de ahí los errores en la definición de hipótesis.
¿Hay alguna base para este razonamiento? Después de todo, la serie obtenida por la suma mencionada se puede obtener sin ella - por casualidad, y se puede obtener por otra suma de otras parcelas con otras leyes. Y puesto que este es el caso - ¿cuál es el caso (que es cierto)?
En mi post he argumentado que no hay base para ello. en AT simplemente no hay otra forma.
¿Sobre qué base se considera que es así?
No es mi opinión - en eso se basa toda la matestadística.
¿Qué tiene eso que ver con el hecho de que un modelo con parámetros diferentes pueda ser más óptimo en los siguientes pasos?
No existe tal cosa como "óptimo". O hay un ajuste con cierto nivel de confianza o no lo hay. Hay un ajuste - hay una predicción
No está claro - ¿puede describir con más detalle lo que quiere decir?
El número de SV en BP no interviene en la determinación de la estacionariedad.
¿Y sobre qué base se puede decidir algo si se desconocen las causas?
Esta es la norma para los procesos aleatorios. Si se conocen las causas, entonces lo más probable es que sea un proceso determinista.
Ahora no estoy de acuerdo en principio. Con el propio enunciado. ¿Cómo puede hacerse estacionaria una serie cuyas características cambian aleatoriamente? Es decir, este planteamiento no se fundamenta en nada, ¿de qué hipótesis podemos hablar?
GARCH es un modelo con volatilidad cambiante, por ejemplo.
Tenemos una discusión de dos personas y se ha vuelto demasiado abstracta. Incluso el topkstarter no participa. Me gustaría un poco de coherencia en la discusión y el desarrollo del artículo en discusión. Por ejemplo, en el primer paso, sobre un ejemplo concreto, considerar en detalle el análisis preliminar de los datos y su preparación para la modelización. Por ejemplo:
1. Justificación del tamaño de la muestra.
2. Justificación de la necesidad de transformación de los datos.
3. Elección de cómo transformar los datos:
- tratamiento de los valores atípicos y los datos que faltan.
- Transformación de datos: eliminación de tendencias, ciclicidad.
4. Determinación de los tipos de tendencias y su contabilización
5. Ajuste de la distribución a los datos transformados.
6. 6. Análisis de la estacionariedad de los datos transformados.
7. Contabilización de la heteroscedasticidad
Por ahora es suficiente. Otro plan es bastante permisible. Me gustaría organizar alguna presentación sistemática del problema de la preparación del cociente para la modelización descrita en el documento objeto de debate.Topikstarter[espiguillas, aún no se llama así] está en una pequeña crisis creativa :-))))
Pero está siguiendo la discusión....
Agradece a faa1947 sus comentarios constructivos...
-Alexey-, te recomendaría estudiar la matriz ...
Tendré en cuenta todos los comentarios, más adelante presentaré mis contraargumentos y argumentos...
-Alexey-, te recomendaría estudiar la matriz....
¿Qué secciones puedes recomendar? A cada una de mis afirmaciones (incluidas las preguntas) puedo proporcionar un enlace a la matriz.
P.D. ¿Y con qué momento está relacionada la crisis creativa, si no es un secreto? :)