Ecuación de regresión - página 4

 
¿Y la elección del polinomio?
 
j21 20.09.2010 02:32 ¿Y la elección del polinomio?

Creo que si el número de grados de libertad es fácil y el tipo de dependencia está a priori claro, ¿cuál es la cuestión?

Privado:


Z.I. Debo haberme perdido la Isla del Desierto. Me gustaría leer algo sensato...

No sé, pero esta isla parece estar flotando en la noosfera...

Y la población se engaña en su inmortalidad.

Yo creo que sí.

 
FreeLance:

¿Puede ser más específico?

El MOC se posiciona, entre otras cosas, como un método para estimar los mejores parámetros de una función seleccionada a priori por el investigador.

Las fórmulas para calcular estos parámetros minimizando el cuadrado de la desviación de los datos reales respecto a la función de aproximación se derivan para una variedad de funciones.

¿Dónde aparecen las colas gordas?

Por favor, ilumíname...

Las colas gruesas pueden producirse si el modelo elegido por el investigador no es adecuado para la serie real. La comprobación estándar de la adecuación de cualquier modelo de regresión a los datos reales es la distribución de los residuos. Los residuos son la desviación de los datos reales con respecto a los datos del modelo. Si el modelo es adecuado, la distribución de los residuos será normal. El CNA minimiza la suma de estas desviaciones, pero la distribución de los residuos no será necesariamente normal, aunque en algunas partes de la serie puede serlo. La regresión lineal tiene sentido para el modelo SB con deriva o en algunas partes de la serie que satisfacen este modelo. Si se sabe cómo identificar esos segmentos antes de que terminen, la regresión lineal tiene sentido práctico. Y el CNA sólo recoge los parámetros del modelo elegido, no garantiza la idoneidad del propio modelo. Por eso no es culpa de MNC: lo que importa es la selección de un modelo adecuado y su correcta parametrización. Y el modelo puede ser de cualquier tipo: estacionario/no estacionario o suma de diferentes distribuciones, por ejemplo. imha

Véase https://www.mql5.com/go?link=http://emm.ostu.ru/lect/lect6_2.html[hash]vopros11 "Comprobación de la adecuación del modelo de regresión" para más detalles.

 
Avals:

Las colas gruesas pueden producirse si el modelo elegido por el investigador no es adecuado para la serie real. La prueba estándar de la adecuación de cualquier modelo de regresión a los datos reales es la distribución de los residuos. Los residuos son la desviación de los datos reales con respecto a los datos del modelo. Si el modelo es adecuado, la distribución de los residuos será normal. El CNA minimiza la suma de estas desviaciones, pero la distribución de los residuos no será necesariamente normal, aunque en algunas partes de la serie puede serlo. La regresión lineal tiene sentido para el modelo SB con deriva o en algunas partes de la serie que satisfacen este modelo. Si se sabe cómo identificar esos segmentos antes de que terminen, la regresión lineal tiene sentido práctico. Y el CNA sólo recoge los parámetros del modelo elegido, no garantiza la idoneidad del propio modelo. Por eso no es culpa de MNC: lo que importa es la selección de un modelo adecuado y su correcta parametrización. Y el modelo puede ser de cualquier tipo: estacionario/no estacionario o suma de diferentes distribuciones, por ejemplo. imha

Para más detalles https://www.mql5.com/go?link=http://emm.ostu.ru/lect/lect6_2.html[hash]vopros11 "Checking regression model adequacy".

¿Escribiste esto para mí? o)

De eso hablaba el otro día...

FreeLance 19.09.2010 15:52
Matemáticas:
Pues bien, obtén una distribución empírica de los errores cuando se aproxima por un polinomio. Y compáralo con el normal. Preste especial atención a las colas, no a la parte central.

¿Estamos hablando de elegir los mejores (en el sentido de MNC) parámetros polinómicos?

¿O estamos hablando de elegir a los mejores en otro sentido?

¿O sobre la corrección del polinomio para la aproximación?

Pedí una explicación de la ineficiencia de MNC para calcular los parámetros de una función preseleccionada (después de todo, la razón de la cola gruesa puede estar en una función desafortunada :).

Y si hay procedimientos igualmente sencillos para determinar estos parámetros, estaré encantado de conocerlos.

Pero me sorprende la formulación de la pregunta: como hay colas en los errores, el MNC no sirve...

;)

Hay una idea diferente que se está impulsando aquí -

Matemáticas:

Esta función objetivo -suma de cuadrados del error- sólo es óptima cuando la propia distribución del error es normal.

;)

 
FreeLance:

¿Me has escrito esto? o)

Eso es lo que decía el otro día...

FreeLance 19.09.2010 15:52

Yo no escribí en contra del citado, incluso estaba a favor :)

 
Avals:

No estoy en contra de la cotización, incluso estoy a favor :)

Gracias por su ayuda en el debate.

Pero la pregunta/respuesta de Alexey sigue abierta.

Aplique la ISC sólo si está seguro de que la futura distribución de errores es normal...

Como en - conocer el precio...

;)

 
FreeLance:

Aplique la ISC sólo si está seguro de que la futura distribución de errores es normal...

;)

Parece que sí (según google :)), el MNC es óptimo si el error de medición se distribuye normalmente. Para otras distribuciones de error, existe el método de mínimos módulos (los errores se distribuyen por Laplace) y el método de máxima verosimilitud (en general, si se conoce la distribución del error). El MNC no siempre es lo mejor :)

Sin embargo, en nuestro caso la distribución de errores sigue siendo desconocida...

 

FreeLance:

Aplique el CNA sólo si está seguro de que la futura distribución de errores es normal...


Sí, y estoy de acuerdo con Alexey en que el MNC en el caso gaussiano es equivalente al método de máxima probabilidad. Para otras distribuciones da resultados peores e incluso mucho peores. Recuerdo que, cuando estudiaba en el instituto la asignatura de Matemática, una frase habitual de los profesores, que siempre me desconcertaba, era: "Como es más fácil hacer los cálculos de esta manera (!!!!), supondremos que la distribución de errores es gaussiana". Pocos piensan que incluso los fundadores de estos métodos (Euler en particular) advirtieron a los investigadores del peligro de sacrificar la lógica del razonamiento en aras de la simplicidad de los cálculos. En consecuencia, el aparato matemático de los métodos alternativos está poco desarrollado y hay que hacer e inventar todo a medias por uno mismo. Menos mal que mis padres me mandaron a estudiar ingeniería :)))

j21,

En cuanto a la elección del polinomio, personalmente no veo el sentido de ir más allá del tercer o cuarto grado.

 
Avals:

Parece que sí (según google :)), el MOC es óptimo si el error de medición se distribuye normalmente. Para otras distribuciones de error, existe el método de mínimos módulos (los errores se distribuyen por Laplace) y el método de máxima verosimilitud (en general, si se conoce la distribución del error). El MNC no siempre es el mejor :)

Cierto, en nuestro caso la distribución de errores es aún desconocida...

Todo esto significa que debemos aproximar la función "plausible", no lo que...

del cuarto grado.

;)

 

Permítanme explicarlo con un ejemplo


P.D. Por si acaso, me explico: esta figura muestra claramente lo que una fuerte expulsión puede hacer al MNC. La expulsión es, por supuesto, bastante prominente aquí, aparentemente en aras de la claridad.

Razón de la queja: