Estadística de la dependencia entre comillas (teoría de la información, correlación y otros métodos de selección de características) - página 8

 
Avals:

en este caso no se exige la independencia, según entiendo, sino que es precisamente el objeto de la evaluación.
Es necesario. Y la entropía se evalúa como una estimación probabilística.
 
HideYourRichess:
Es necesario. Y la entropía se estima como una estimación de probabilidad.

¿Dónde está escrito que se requiera la independencia? ¿Apariencia de las letras en el texto en ruso independientemente del contexto (letras anteriores)?
 
alexeymosc:
Muchos ejemplos de aplicaciones de la CT, en lengua rusa, se refieren al análisis del alfabeto del ruso, y de otras lenguas, así como al análisis de palabras y frases (secuencias de palabras). Y todos estos caracteres no son estadísticamente independientes a priori, y mediante estos ejemplos se estima la información mutua, un valor que muestra la cantidad de dependencia. Así pues, la independencia a priori de los valores en estudio no es un requisito previo para la correcta aplicación de la IT.

Argumentación muy débil, a nivel de que en algún lugar se lee, que en algún lugar se utiliza, para algo allí, en este.... Exactamente sobre esto el diccionario académico nos escribió, - "Para el modelado de los sistemas de comunicación tal enfoque es legítimo, ya que están destinados a la transferencia sin errores en un canal de comunicación de la información representada por cualquier conjunto de símbolos.Sin embargo, cuando la consideración del valor y el significado de la información es esencial, el enfoque cuantitativo es inaplicable. Esta circunstancia impone restricciones esenciales a los campos de aplicación posibles de la CT. No tenerlo en cuenta llevó en las primeras fases de desarrollo a sobreestimar la importancia aplicada.


 
Avals:

¿Dónde está escrito que se requiera la independencia? La aparición de letras en el texto en ruso independientemente del contexto (letras anteriores)?
¿No queda claro en el planteamiento del problema? La redacción, por cierto, es bastante clásica para ter.ver.
 
alexeymosc:

Es un defecto de las estadísticas. Por cierto, yo también lo uso.
Por fin puede hacer un diagnóstico informado.
 
faa1947: Abro en el paquete STATISTICS la pestaña "data mining" - unos 20 nombres de secciones y procedimientos separados. Todo esto concuerda perfectamente con los libros de texto y las monografías en este campo, pero nada sobre TI para la minería de datos.

Es maravilloso. El paquete Statistica es la única fuente a la que acudir para la extracción de datos. Por lo tanto, debería prohibirse su uso a TI. Y prohíbe también tu propio cerebro, porque con Statistica ya no lo necesitas.

Roman: Alexey, puedes decir, si es realista traducir todo este placer en el código en la dirección que nos interesa...

A. Sergeev hizo algo parecido al traducir el indicador de Sultonov a código, ¿o me equivoco?

Es bastante factible. No veo ningún límite allí, pero es posible hacer sumas y logaritmos en MQL4. No sé lo que hizo Sergeev. Pero por lo que sé de otras fuentes, la parte más difícil de los cálculos era el cálculo de la función gamma. TI estaba fuera de toda duda.

HideYourRichess: ¿Tienes eventos elementales, volver, son idénticos a los eventos elementales de TI? [...] De ahí la pregunta, ¿qué tipo de "símbolos" tenemos en el mercado?

Ya está la respuesta de alexeymosc sobre esto: son incrementos [relativos], que pueden ser discretizados específicamente para este propósito. Mi alfabeto final contiene entre 15 y 50 caracteres.

Me anticipo a la siguiente pregunta: "¿Es posible hacer este tipo de discretización sin derramar al niño de la bañera?". ¿Y por qué no? Realmente no tengo un procedimiento para comprobar si lo he hecho correctamente, pero algunas comprobaciones de casos extremos y particulares muestran que no he cometido ningún error fatal. La fuente con el receptor también está ahí.

Ese es el canal de comunicación: no es tan fácil de responder. Esa parece ser la pregunta con la que me vas a matar...

Hay una supuesta respuesta que puede parecerte herética: es el tiempo presente, es decir, el periodo de tiempo en el que la información del pasado se transmite a la barra cero.

HideYourRichess: Si no implica "significados económicos y de otro tipo", ¿de qué procesos estamos hablando? Un proceso es un fenómeno "físico", tiene causas y tiene consecuencias. Por ejemplo, el proceso de una manzana que cae sobre la cabeza de Newton. En la aplicación a los mercados, el proceso de compra y venta. ¿Dónde está todo en las devoluciones?

Creo que eres excesivamente mecanicista, querida. Un proceso puede ser legítimamente un fenómeno de información, consistente en la generación de rendimientos basados en procesos reales de compra y venta.

HideYourRichess: ter.ver, en el que se basa ter.inf., requiere la independencia de los eventos en cuestión, o símbolos.

Muéstrame la fuente en la que se afirma esto. Dudo que encuentres uno.

¿Dónde has visto que terver requiera independencia - si es que esta misma independencia es un concepto definible en terver? ¿Y qué crees que son las cadenas de Markov? ¿Y los teoremas de Bayes? ¿Y el concepto de probabilidad condicional en general?

Avals: Alexey, ¿dónde están los cálculos que dan lugar a "dependencias lejanas y prácticamente fiables"? ¿Y qué significa la rentabilidad neta sin volatilidad (cómo se obtiene, porque sólo la rentabilidad contiene volatilidad)?

Bueno, ya te dije que era un ignorante de la econometría y que estaba irremediablemente confundido con el concepto de volatilidad...

No quiero publicar el código de cálculo aquí, todavía es un saber hacer. Pero puedo contarte en privado cómo los hice.

 
HideYourRichess:
¿No está claro por las condiciones del problema? La formulación, por cierto, es bastante clásica para ter.ver.


Yo no)))) si se requiere independencia, entonces ¿por qué tal cosa como la entropía condicional?

Si la secuencia de símbolos del alfabeto no es independiente (por ejemplo, en francés la letra "q" va casi siempre seguida de la "u", y la palabra "vanguardia" en los periódicos soviéticos solía ir seguida de "producción" o "trabajo"), la cantidad de información que transporta la secuencia de dichos símbolos (y, por tanto, la entropía) es obviamente menor. Laentropía condicional se utiliza para dar cuenta de estos hechos. https://ru.wikipedia.org/wiki/Информационная_энтропия

 
faa1947:
Finalmente se puede hacer un diagnóstico razonable.


Ábrelo.

Por cierto, Statistics no tiene una característica tan útil como un algoritmo genético para seleccionar las variables de entrada, que sí tiene NeuroShell. Es decir, un solo producto no puede adaptarse a todo. Matlab tampoco tiene una función integrada para calcular la información mutua, pero se ha escrito un módulo correspondiente que, por cierto, está muy solicitado.

 

Mathemat:

Creo que estás siendo demasiado mecanicista, querida. Un proceso puede ser legítimamente un fenómeno de información, consistente en la generación de rendimientos basados en procesos reales de compra y venta.

Así es como aparecen los rendimientos reales: comprar, vender, comprar, vender...

Matemáticas:

Muéstrame la fuente en la que se afirma esto. Dudo que lo encuentres.

¿Dónde has visto que un terver requiera independencia - si esta misma independencia es un concepto definible en el terver? ¿Y qué crees que son las cadenas de Markov? ¿Y los teoremas de Bayes? ¿Y el concepto de probabilidad condicional en general?

Ni Markov ni Bayes tienen nada que ver con TI. Pero la fe terrestre sí. Y créanme, la exigencia de la independencia es la piedra angular de la ter.ver. sobre la que son incluso demasiado perezosos para escribir.
 

Lo siento, HideYourRichess, pero parece que se te ha ido la olla. Ya no sé qué debatir contigo ya que te empeñas en decir tonterías. Su lógica de razonamiento

Ни Марков, ни Байес не имеют отношения к ТИ. А тер.вер. имеет.

es completamente incomprensible para mí.

No lo creeré. Muéstrame la fuente que afirma que

La demanda de independencia es la piedra angular de la ter.fe.

Razón de la queja: