Estadística de la dependencia entre comillas (teoría de la información, correlación y otros métodos de selección de características) - página 7

 
TheXpert:

¿Cómo pueden ser discretos si se trabaja con incrementos relativos?

Y la segunda pregunta - ¿cuál es el número de caracteres ) ?


Y los discretizamos. Hay dos esquemas principales: son los cuantiles (que hacen que la PDF sea igual) y el espaciado igual (la PDF es muy similar al resultado en los datos brutos).

El número de caracteres lo fija el investigador.

 
Mathemat: Y para mí, en esta tarea, TI es sobre todo una herramienta deextracción de datos. Qué hacer con estos datos es otra cuestión. Lo importante es que sí vemos algo que no es visible a simple vista. ¿Y de qué otras ciencias hablas?

Abro en el paquete STATISTICS la pestaña "data mining" - unos 20 nombres de secciones y procedimientos separados. Todo esto se ajusta perfectamente a los libros de texto y monografías en este campo, pero nada sobre TI para la minería de datos.

 
alexeymosc:
Obviamente, parece que en nuestra interpretación del proceso, se trata de valores discretos de los rendimientos.

Si no implica "significados económicos y de otro tipo", ¿de qué procesos estamos hablando? Un proceso es un fenómeno "físico", tiene causas y consecuencias. Por ejemplo, el proceso de una manzana que cae en la cabeza de Newton. En la aplicación a los mercados, el proceso de compra y venta. ¿Dónde está todo esto en el mercado?

Siguiente punto. El ter.ver, en el que se basa el ter.inf, requiere la independencia de los eventos en cuestión, o símbolos. De lo contrario, el uso de estos aparatos matemáticos es incorrecto. ¿En qué lugar se establece la independencia? Supongamos que yo, por intenciones especulativas, compro unas acciones (me refiero al mercado real, no a la casa de bolsa), y se produce un retorno en los precios. Al cabo de un tiempo, decidí vender estas acciones y se produjo otro retorno. Estos dos acontecimientos están claramente relacionados entre sí a través de mí y de mis intenciones especulativas. Como hay muchos tontos como yo en el mercado, y todos compran y venden de la misma manera, todos los rendimientos resultan estar vinculados - dependientes. Entonces, ¿por qué intentas aplicar un aparato matemático a eventos dependientes de otros independientes? ¿Es correcto?

En esto, todo está lejos de ser obvio.

 
faa1947:

Abro en el paquete STATISTICS la pestaña "data mining" - unos 20 nombres de secciones y procedimientos individuales. Todo esto se ajusta perfectamente a los libros de texto y las monografías sobre el tema, pero nada sobre TI para la minería de datos.


Esto es un defecto de las estadísticas. Por cierto, yo también lo uso.
 
alexeymosc:

Y los discretizamos. Hay dos esquemas principales: son los cuantiles (que hacen que la PDF sea igual) y el espaciado igual (la PDF es muy similar al resultado en los datos brutos).

El número de caracteres lo fija el investigador.

Es decir, si no conocemos el alfabeto del mercado, inventemos uno nosotros mismos, y eso es lo que estudiaremos.

Puedo estar equivocado, por supuesto, y lo hago con no poca frecuencia, pero este enfoque no me parece bueno.

 
HideYourRichess:

Es decir, si no conocemos el alfabeto del mercado, inventémoslo nosotros y estudiémoslo exactamente.

Puedo estar equivocado, por supuesto, y lo hago con no poca frecuencia, pero este enfoque no me parece bueno.


Verás, no quiero discutir y no me gusta, pero eso es lo que hacen los investigadores con las variables continuas, las discretizan. No hay otra manera, la alternativa es no aplicar TI a las variables continuas en absoluto.

Cómo hacerlo es un tema aparte. Existe una metodología para determinar el número de caracteres de un alfabeto mediante el análisis de la distribución de valores continuos (llamada Parzen Windows - reglas de Google...), pero no la he utilizado en este caso y creo que me he perdido un poco.

 
Parece que no has entendido nada de lo que estabas hablando. Bueno, buena suerte.
 
HideYourRichess:
Parece que no has entendido nada de lo que estabas hablando. Bueno, buena suerte.

Entiendo su razonamiento sobre la independencia de los incrementos. No estoy seguro de estar completamente de acuerdo. Yo también consultaría a Mathemat sobre este tema.
 
HideYourRichess:

Si no implica "significados económicos y de otro tipo", ¿de qué procesos estamos hablando? Un proceso es un fenómeno "físico", tiene causas y consecuencias. Por ejemplo, el proceso de una manzana que cae en la cabeza de Newton. En la aplicación a los mercados, el proceso de compra y venta. ¿Dónde está todo en el mercado?

Siguiente punto. El ter.ver, en el que se basa el ter.inf., requiere la independencia de los hechos en cuestión, o de los símbolos. De lo contrario, el uso de estos aparatos matemáticos es incorrecto. ¿Dónde está la independencia inherente? Supongamos que yo, por intenciones especulativas, compro unas acciones (me refiero al mercado real, no a la casa de bolsa), y se produce un retorno en los precios. Al cabo de un tiempo, decidí vender estas acciones y se produjo otro retorno. Estos dos acontecimientos están claramente relacionados entre sí a través de mí y de mis intenciones especulativas. Como hay muchos tontos como yo en el mercado, y todos compran y venden de la misma manera, todos los rendimientos resultan estar vinculados - dependientes. Entonces, ¿por qué intentas aplicar un aparato matemático a eventos dependientes de otros independientes? ¿Es correcto?

En esto, todo está lejos de ser obvio.


En este caso, la independencia no es necesaria, según entiendo, sino que es precisamente objeto de evaluación.
 
Muchos ejemplos de aplicación de la IT, en ruso, se refieren al análisis de los alfabetos del ruso, y de otras lenguas, así como al análisis de palabras y frases (secuencias de palabras). Y todos estos caracteres no son a priori estadísticamente independientes, y por estos ejemplos se estima la información mutua, un valor que muestra la cantidad de dependencia. Por lo tanto, la independencia a priori de los valores en estudio no es un requisito previo para la correcta aplicación del IT.
Razón de la queja: