Statistiche di dipendenza nelle citazioni (teoria dell'informazione, correlazione e altri metodi di selezione delle caratteristiche) - pagina 7

 
TheXpert:

Come possono essere discreti se si lavora con incrementi relativi?

E la seconda domanda: qual è il numero di caratteri?


E li discretizziamo. Ci sono due schemi principali: sono i quantili (rendendo la PDF uguale) e la spaziatura uguale (la PDF è molto simile al risultato sui dati grezzi).

Il numero di caratteri è stabilito dal ricercatore.

 
Mathemat: E per me in questo compito, TI è principalmente uno strumento di datamining. Cosa fare con questi dati è un'altra questione. La cosa importante è che vediamo qualcosa che non è visibile ad occhio nudo. E di quali altre scienze parla?

Apro nel pacchetto STATISTICS la scheda "data mining" - circa 20 nomi di sezioni e procedure separate. Tutto questo è perfettamente in linea con i libri di testo e le monografie in questo campo, ma niente su TI per il data mining.

 
alexeymosc:
Ovviamente, sembra che nella nostra interpretazione del processo, questi siano valori discreti di rendimento.

Se non si tratta di "significati economici e di altro tipo", allora di quali processi stiamo parlando? Un processo è un fenomeno "fisico", ha cause e conseguenze. Per esempio, il processo di una mela che cade sulla testa di Newton. Nell'applicazione ai mercati, il processo di acquisto e vendita. Dov'è tutto questo nel mercato?

Prossimo punto. Il ter.ver, su cui si basa il ter.inf, richiede l'indipendenza degli eventi in questione, o simboli. Altrimenti l'uso di questi apparati matematici non è corretto. In quale luogo è stabilita l'indipendenza? Supponiamo che io, da intenzioni speculative, compri delle azioni (intendo il mercato reale, non la casa di intermediazione), e che avvenga un ritorno nei prezzi. Dopo un po' di tempo, ho deciso di vendere queste azioni ed è successo un altro ritorno. Questi due eventi sono abbastanza chiaramente collegati tra loro attraverso me e i miei impulsi speculativi. Dato che ci sono molti pazzi come me nel mercato, e tutti comprano e vendono allo stesso modo, tutti i rendimenti risultano essere collegati - dipendenti. Allora perché cercate di applicare un apparato matematico agli eventi dipendenti da quelli indipendenti? È corretto?

Su questo, tutto è tutt'altro che ovvio.

 
faa1947:

Apro nel pacchetto STATISTICS la scheda "data mining" - circa 20 nomi di sezioni e procedure individuali. Tutto questo è perfettamente in linea con i libri di testo e le monografie del settore, ma niente su TI per il data mining.


Questo è un difetto della statistica. A proposito, lo uso anch'io.
 
alexeymosc:

E li discretizziamo. Ci sono due schemi principali: questi sono i quantili (rendendo la PDF uguale) e la spaziatura uguale (la PDF è molto simile al risultato sui dati grezzi).

Il numero di caratteri è stabilito dal ricercatore.

Cioè, se non conosciamo l'alfabeto del mercato, inventiamone uno noi, ed è quello che studieremo.

Potrei sbagliarmi, naturalmente, e lo faccio non di rado, ma questo approccio non mi sembra buono.

 
HideYourRichess:

Cioè, se non conosciamo l'alfabeto del mercato, inventiamocelo e studiamolo esattamente.

Potrei sbagliarmi, naturalmente, e lo faccio non di rado, ma questo approccio non mi sembra buono.


Vedete, non voglio discutere e non mi piace, ma è quello che fanno i ricercatori per le variabili continue, le discretizzano. Non c'è altro modo, l'alternativa è non applicare affatto TI alle variabili continue.

Come fare questo è un argomento a parte. C'è una metodologia per determinare il numero di caratteri di un alfabeto attraverso l'analisi della distribuzione dei valori continui (chiamata Parzen Windows - google rules...), ma non l'ho usata in questo caso e credo di aver perso un po'.

 
Sembra che tu non abbia capito affatto di cosa stavi parlando. Beh, buona fortuna.
 
HideYourRichess:
Sembra che tu non abbia capito affatto di cosa stavi parlando. Beh, buona fortuna.

Capisco il tuo ragionamento sull'indipendenza degli incrementi. Non sono sicuro di essere completamente d'accordo. Consulterei anche Mathemat su questo argomento.
 
HideYourRichess:

Se non si tratta di "significati economici e di altro tipo", allora di quali processi stiamo parlando? Un processo è un fenomeno "fisico", ha cause e conseguenze. Per esempio, il processo di una mela che cade sulla testa di Newton. Nell'applicazione ai mercati, il processo di acquisto e vendita. Dove si trova tutto questo nel mercato?

Prossimo punto. Il ter.ver, su cui si basa il ter.inf., richiede l'indipendenza degli eventi in questione, o dei simboli. Altrimenti l'uso di questi apparati matematici non è corretto. Dov'è l'indipendenza intrinseca? Supponiamo che io, da intenzioni speculative, compri delle azioni (intendo il mercato reale, non la casa di intermediazione), e che avvenga un ritorno nei prezzi. Dopo un po' di tempo, ho deciso di vendere queste azioni ed è successo un altro ritorno. Questi due eventi sono abbastanza chiaramente collegati tra loro attraverso me e i miei impulsi speculativi. Dato che ci sono molti pazzi come me nel mercato, e tutti comprano e vendono allo stesso modo, tutti i rendimenti risultano essere collegati - dipendenti. Allora perché cercate di applicare un apparato matematico agli eventi dipendenti da quelli indipendenti? È corretto?

Su questo, tutto è tutt'altro che ovvio.


In questo caso, l'indipendenza non è richiesta, per come la intendo io, ma è proprio l'oggetto della valutazione.
 
Molti esempi di applicazione del TI, in russo, si riferiscono all'analisi degli alfabeti del russo e di altre lingue, così come all'analisi di parole e frasi (sequenze di parole). E tutti questi caratteri non sono statisticamente indipendenti a priori, e da questi esempi si stima l'informazione reciproca, un valore che mostra la quantità di dipendenza. Quindi l'indipendenza a priori dei valori in studio non è un prerequisito per la corretta applicazione del TI.
Motivazione: