Discusión sobre el artículo "Análisis de los gráficos mediante métodos econométricos" - página 10
Está perdiendo oportunidades comerciales:
- Aplicaciones de trading gratuitas
- 8 000+ señales para copiar
- Noticias económicas para analizar los mercados financieros
Registro
Entrada
Usted acepta la política del sitio web y las condiciones de uso
Si no tiene cuenta de usuario, regístrese
Entiendo, para ello utilizo el concepto de "clase" o "intervalo".
faa1947, en tu figura veo que la distribución no es unimodal. Ese es otro problema.
Entonces el número de clases (racks) también se calcula mediante alguna fórmula, reglas.... las más famosas son:
La fórmula de Sturges, la regla de Freedman-Diaconis, la regla de Scott, la elección de la raíz cuadrada, etc.
denkir :
Creo que sí se puede. No deberían afectar en modo alguno a los parámetros estadísticos de la muestra (en particular, a los parámetros de distribución). Por eso son valores atípicos.
En que el tamaño de la muestra es lo suficientemente grande como para no verse afectado por los valores atípicos. Esta es una de las razones por las que soy partidario de un tamaño de muestra grande. Luego el compañero faa1947 ha dicho, si no me equivoco, que no es lo mismo outliers que valores atípicos. Está claro que si usted tiene por ejemplo eurusd tasa fluctuó en la muestra dentro de $ 1.20-1.50, y luego algún error del servidor apareció y devolvió el valor de $ 15.77, entonces tal un valor atípico se echan a perder todos los parámetros estadísticos de la muestra.
-Alexey-:
Una distribución verdadera caracteriza las propiedades de una serie, pero una no estacionaria es por definición aquella en la que cambian.
Pero dime, ¿qué relación hay entre la distribución verdadera y la estacionariedad? Confieso que nunca he encontrado tal conexión. ¿De dónde la has sacado, si no es un secreto? ;-)
См. мой пост выше -Alexey. Все-таки надо начинать с длины выборка, которая определяется целью прогноза для ТС. Т.е.: достаточна ли длина выборки для ответа на вопрос: можно входить в позу (выходить из позы) или нельзя? Скорее всего длина выборки будет не значительной (до сотни) и исчезнут фантастические распределения, подобные выше приведенному.
La cuestión es la siguiente. Al reducir el tamaño de la muestra, podemos pasar por alto un fenómeno como la agrupación de la volatilidad. Entonces no tiene sentido utilizar un modelo no lineal. Así que podemos utilizar un modelo lineal. Y esto no refleja la naturaleza de la serie financiera, su derivada (no confundir con la derivada en el análisis matricial).
¿Y cuáles son esos datos en base a los cuales has obtenido la distribución bimodal? ¿Podrías subir un archivo con los datos?
La cuestión es la siguiente. Al reducir el tamaño de la muestra, podemos pasar por alto un fenómeno como la agrupación de la volatilidad. Entonces no tiene sentido utilizar un modelo no lineal. Así que podemos utilizar un modelo lineal. Y esto no refleja la naturaleza de la serie financiera, su derivada (no confundir con la derivada en el análisis matricial).
Si profesamos el enfoque sistémico, debemos bailar desde el objetivo: entrada/salida hasta la pose. ¿Cuál será el cociente en el residuo seco? Si tomamos una muestra limitada, no es necesario tener volatilidad o no estacionariedad en absoluto, ¿verdad? Hay que elegir el modelo. ARMA (ni siquiera ARIMA) se utiliza mucho. No tenemos como objetivo aplicar un modelo determinado. El objetivo es obtener una previsión con un nivel razonable de límites de confianza. Es interesante simplemente calcular la previsión para, por ejemplo, 100, 500, 1000 candeleros. Tal vez veamos algo.
¿Y cuáles son esos datos en base a los cuales has obtenido la distribución bimodal? ¿Podrías subir un archivo con los datos?
EURUSD D1 desde 1999/01/04 hasta 2011/01/13, 3063 velas tomadas del terminal.
Sobre la base de que la muestra es lo suficientemente grande como para no responder a valores atípicos. Esta es una de las razones por las que estoy a favor de un tamaño de muestra grande. Luego mi colega faa1947 dijo, si no me equivoco, que no es lo mismo un valor atípico que un valor atípico. Está claro que si, por ejemplo, la cotización del eurusd fluctuó en la muestra dentro del rango de 1,20 a 1,50 dólares, y luego hubo algún error del servidor que devolvió el valor de 15,77 dólares, entonces ese valor atípico estropeará todos los parámetros estadísticos de la muestra.
Pero dime, ¿cuál es la conexión entre la distribución verdadera y la estacionariedad? Confieso que nunca he visto tal conexión. ¿De dónde la has sacado, si no es un secreto? ;-)
Te contesté en la última página con una cita del libro de texto. Si no ha quedado claro, te lo explico con más detalle:
El concepto de población general es en cierto sentido similar al concepto de variable aleatoria (ley de distribución de probabilidad, espacio de probabilidad), porque está completamente condicionado por un determinado conjunto de condiciones.
Un determinado conjunto de condiciones genera un proceso estacionario. Si es indefinido - no hay población general, respectivamente ninguna distribución verdadera. La lógica es más o menos así. Aunque, por supuesto, podría estar equivocado.
De acuerdo con su respuesta - la respuesta es incorrecta. Por cierto, esperaba ver una referencia a la matriz en base a la cual hiciste la afirmación anterior. Si no la tienes (es decir, no sabes por qué se eliminan los valores atípicos y cómo afectan a la distribución), entonces te recomiendo, como me hiciste a mí antes, que te aprendas el material. Todo está claro con los valores atípicos grandes, y tienes razón al señalar que debería haber una comprobación para ellos (dicha comprobación puede detectar un hueco entre comillas), pero la pregunta no es sobre ellos, sino sobre 3-4-5 sigma. También es interesante que incluso sin tocar la cuestión de si se deben eliminar o no, la metodología de su eliminación (al menos según el libro mencionado anteriormente, aunque no lo dice todo) es un trabajo muy grande y largo, como creo, y bastante complicado.
Un determinado conjunto de condiciones genera un proceso estacionario. Si es incierto, no hay población general y, por tanto, no hay distribución verdadera. La lógica es más o menos así. Aunque, por supuesto, puedo estar equivocado.
Según Wikipedia: la población general es el conjunto de valores que un investigador ha seleccionado para su análisis. Un investigador puede muestrear en la población general mediante cualquier regla, incluyendo algo tan dudoso como la "estacionariedad". Es normal cuando se selecciona una regla fuera de los conceptos de la estadística, por ejemplo, "todas las transacciones de compra de euros por rublos". Las transacciones son generadas por algún proceso económico que sólo conocemos aproximadamente, no sabemos el número de transacciones. Estas dos circunstancias nos hacen considerar que la no estacionariedad es la característica principal de las cotizaciones de las divisas, todo lo demás son sus signos.
Todo está claro con los valores atípicos grandes, y has señalado correctamente que debería haber una comprobación de ellos (dicha comprobación puede detectar un desfase en las cotizaciones), pero el discurso (y la pregunta) no es sobre ellos, sino sobre 3-4-5 sigmas.
Además, traigo histogramas de cotizaciones D1 del par euro-dólar en la cantidad de 100 candeleros.
Aquí están las estadísticas descriptivas de la muestra
Además, uno de los valores de Close fue cambiado constantemente a 3 sigma, 5 sigma y 5 promedio.
Vemos:
1. Cola zurda por todas partes.
2. 2. El número de columnas del histograma cambia, a pesar de que se especifican 20 intervalos por cada 100 velas en todas partes.
3. Cambia el valor p del ajuste a la ley normal y, en consecuencia, el intervalo de confianza del ajuste.
La mitad es errónea y la otra mitad está infravalorada, una parte es correcta. Por eso es deseable comprobar Wiki con la literatura especializada, y tenerlo - recomendado por el Ministerio de Educación y todo eso. Más adelante escribiré una definición del diccionario enciclopédico de estadística. Creo que estás completamente confundido.
Una población es un conjunto de valores que un investigador ha seleccionado para su análisis.
La mitad es errónea, y la otra mitad está infravalorada, y parte es correcta. Por lo tanto, es conveniente comprobar Wiki con la literatura especializada, y que sea recomendado por el Ministerio de Educación y todo eso. Más adelante escribiré una definición del diccionario enciclopédico de estadística. Creo que estás completamente confundido.
Esto es sólo cuando se toman todos los datos existentes y se sabe que no hay otros. De lo contrario, si tomo 10 velas, eso es una muestra de población, no una población general. Por ejemplo, cuando se mide el trabajo de una máquina, se sabe que mañana habrá nuevos datos, no hay población general nunca. Se evalúa sobre la población general (muestra) - leer sobre evaluaciones. Y en la estimación no se ajusta a la ley normal (si no se sabe que es tal), pero la ley se identifica por métodos especiales, y mientras se desconoce - ¿cómo se puede quitar algo (te di un enlace al libro - está escrito sobre ello allí). Y además se evalúa no por una muestra, sino por varias, se comparan pruebas especiales, etc.Desgraciadamente, te has permitido sacar de contexto frases sueltas, sin intentar comprender el sentido de mi post. Una vez más. En forex, la regla para seleccionar la población general son todas las operaciones que no conocemos. No estoy interesado en la definición de la enciclopedia como de Wiki - Estoy interesado en la previsión, no en las propiedades estadísticas de la población general. Bajo tu presión casi me meto en fornicación botánica e incluso fui al paquete STATISTICS para ver la definición de "población general": el mundialmente famoso paquete no considera este concepto.
Limpieza de emisiones. Dio detalles del efecto de las emisiones en el ajuste, fíjate bien. Si no eliminas la emisión, obtendrás un ajuste erróneo, de eso se trata, y muy posiblemente con muy buenas características. Si cambias el valor atípico, cambiarán los parámetros de la ley o la ley, todo por culpa de uno o dos valores de la muestra. Después del ajuste, no es necesario limpiar los datos.
Sigue siendo muy conveniente que leas libros de texto, y mejor documentación de paquetes mat sobre econometría, no sobre matestadística - mejorará tu comprensión. Cualquier paquete econométrico empieza con la preparación de los datos para el análisis, no al revés, primero el ajuste y luego la preparación de los datos.
. :) Simplemente no quería que los lectores se despistaran, pero espero que los que lo necesiten se den cuenta.
Ok, te dejo con ello.
No creo que sea la decisión correcta
Cualquier paquete es sólo una herramienta, nada más. Parece que hablamos idiomas diferentes.
Por favor, perdóname por dejarte dar consejos sobre paquetes. En argumentos teóricos, como tesis y disertaciones, tu enfoque es bastante válido y preferible al mío. Pero tenemos un problema práctico y un paquete no es sólo una herramienta, sino un sistema en el que se reúnen muchos conceptos para producir un resultado práctico. No sólo obtenemos una interpretación inequívoca de los términos, sino también su cálculo inequívoco. El autor del artículo mencionó GARCH, y éste es un concepto muy elástico, mucho menos inequívoco que "población general".
Espero que sigas participando en el tema.