Statistiche di dipendenza nelle citazioni (teoria dell'informazione, correlazione e altri metodi di selezione delle caratteristiche) - pagina 8

 
Avals:

in questo caso l'indipendenza non è richiesta come la intendo io, ma è proprio l'oggetto della valutazione.
È richiesto. E l'entropia è valutata come una stima probabilistica.
 
HideYourRichess:
Richiesto. E l'entropia è stimata come una stima di probabilità.

Dove sta scritto che è richiesta l'indipendenza? Apparizione di lettere nel testo in lingua russa indipendentemente dal contesto (lettere precedenti)?
 
alexeymosc:
Molti esempi di applicazioni di TC, in lingua russa, si riferiscono all'analisi dell'alfabeto russo e di altre lingue, così come all'analisi di parole e frasi (sequenze di parole). E tutti questi caratteri non sono a priori statisticamente indipendenti, e da questi esempi si valuta l'informazione reciproca, un valore che mostra la quantità di dipendenza. Quindi l'indipendenza a priori dei valori in studio non è un prerequisito per la corretta applicazione del TI.

Argomentazione molto debole, al livello di quel da qualche parte letto, che da qualche parte è usato, per qualcosa lì, su questo.... Esattamente su di esso il dizionario accademico ci ha scritto, - "Per la modellazione dei sistemi di comunicazione tale approccio è legittimo, in quanto sono destinati al trasferimento senza errori su un canale di comunicazione dell'informazione rappresentata da qualsiasi insieme di simboli. Dove, tuttavia, la considerazione del valore e del significato delle informazioni è essenziale, l'approccio quantitativo è inapplicabile. Questa circostanza impone delle restrizioni essenziali ai campi di applicazioni possibili del TC. Non tenerne conto ha portato nelle prime fasi di sviluppo a sovrastimare l'importanza applicata.


 
Avals:

Dove sta scritto che è richiesta l'indipendenza? La comparsa di lettere nel testo in lingua russa indipendentemente dal contesto (lettere precedenti)?
Non è chiaro dalla dichiarazione del problema? La formulazione, tra l'altro, è abbastanza classica per il ter.ver.
 
alexeymosc:

È un difetto della statistica. A proposito, lo uso anch'io.
Puoi finalmente fare una diagnosi informata.
 
faa1947: Apro nel pacchetto STATISTICS la scheda "data mining" - circa 20 nomi di sezioni e procedure separate. Tutto questo è perfettamente d'accordo con i libri di testo e le monografie in questo campo, ma niente su TI per il data mining.

Meraviglioso. Il pacchetto Statistica è l'unica fonte a cui rivolgersi per il data mining. Pertanto, a TI dovrebbe essere vietato usarlo. E bandite anche il vostro cervello, perché con Statistica non ne avete più bisogno.

Roman: Alexey, puoi dire se è realistico tradurre tutto questo piacere nel codice nella direzione che ci interessa...

A. Sergeev ha fatto qualcosa di simile mentre traduceva l'indicatore di Sultonov in codice o mi sbaglio?

È abbastanza fattibile. Non vedo limiti, ma è possibile fare somme e logaritmi in MQL4. Non so cosa abbia fatto Sergeev. Ma per quanto ne so da altre fonti, la parte più difficile dei calcoli era il calcolo della funzione gamma. TI era fuori questione.

HideYourRichess: Avete eventi elementari, ritorno, sono identici agli eventi elementari di TI? [...] Da qui la domanda: che tipo di "simboli" abbiamo sul mercato?

C'è già la risposta di alexeymosc su questo: sono incrementi [relativi], che possono essere discretizzati appositamente per questo scopo. Il mio alfabeto finale contiene tra 15 e 50 caratteri.

Anticipo la prossima domanda: "È possibile fare questo tipo di discretizzazione senza fuoriuscire dal ragazzo del bagno? E perché no? Non ho davvero una procedura per controllare se l'ho fatto correttamente, ma alcuni controlli di casi estremi e particolari mostrano che non ho fatto nessun errore fatale. C'è anche la fonte con il ricevitore.

Questo è il canale di comunicazione - non è così facile rispondere. Questa sembra essere la domanda con cui mi ucciderai...

C'è una presunta risposta che può sembrarvi eretica: è il tempo presente, cioè il periodo di tempo in cui le informazioni del passato vengono trasmesse alla barra zero.

HideYourRichess: Se non si tratta di "significati economici e di altro tipo", allora di quali processi stiamo parlando? Un processo è un fenomeno "fisico", ha cause e conseguenze. Per esempio, il processo di una mela che cade sulla testa di Newton. Nell'applicazione ai mercati, il processo di acquisto e vendita. Dov'è tutto nei ritorni?

Credo che tu sia eccessivamente meccanicista, mia cara. Un processo può essere legittimamente un fenomeno informativo, consistente nella generazione di rendimenti basati su processi reali di acquisto e vendita.

HideYourRichess: ter.ver, su cui si basa ter.inf., richiede l'indipendenza degli eventi in questione, o dei simboli.

Mostrami la fonte in cui si afferma questo. Dubito che ne troverete uno.

Dove hai visto che terver richiede indipendenza - se questa stessa indipendenza è un concetto definibile in terver? E cosa pensate che siano le catene di Markov? E i teoremi di Bayes? E il concetto di probabilità condizionata in generale?

Avals: Alexey, dove sono i calcoli che portano a "dipendenze lontane e praticamente affidabili"? E cosa significa rendimenti netti senza volatilità (come si ottengono, perché solo i rendimenti contengono volatilità)?

Beh, ti ho detto che ero ignorante in econometria e irrimediabilmente confuso sul concetto di volatilità...

Non voglio postare il codice di calcolo qui, è ancora un know-how. Ma posso dirvi in privato come li ho fatti.

 
HideYourRichess:
Non è chiaro dalle condizioni del problema? La formulazione, tra l'altro, è abbastanza classica per il ter.ver.


Io non)))) se l'indipendenza è richiesta, allora perché una cosa come l'entropia condizionata?

Se la sequenza dei simboli dell'alfabeto non è indipendente (per esempio, in francese la lettera "q" è quasi sempre seguita da "u", e la parola "avanguardia" nei giornali sovietici era solitamente seguita da "produzione" o "lavoro"), la quantità di informazione che la sequenza di tali simboli porta (e, quindi, l'entropia) è ovviamente minore. L'entropia condizionata è usata per rendere conto di questi fatti. https://ru.wikipedia.org/wiki/Информационная_энтропия

 
faa1947:
Finalmente si può fare una diagnosi ragionevole.


Aprire.

A proposito, Statistics non ha una caratteristica così utile come un algoritmo genetico per selezionare le variabili di input, che NeuroShell ha. Cioè, un solo prodotto non può ospitare tutto. Anche Matlab non ha una funzionalità incorporata per calcolare l'informazione reciproca, ma un modulo corrispondente è stato scritto e, per inciso, è molto richiesto.

 

Mathemat:

Credo che tu sia troppo meccanicista, mia cara. Un processo può essere legittimamente un fenomeno informativo, consistente nella generazione di rendimenti basati su processi reali di acquisto e vendita.

Ecco come appaiono i veri rendimenti: comprare, vendere, comprare, vendere...

Matematica:

Mostrami la fonte in cui si afferma questo. Dubito che lo troverete.

Dove hai visto che un terver richiede indipendenza - se questa stessa indipendenza è un concetto definibile nel terver? E cosa pensate che siano le catene di Markov? E i teoremi di Bayes? E il concetto di probabilità condizionata in generale?

Né Markov né Bayes hanno nulla a che fare con TI. Ma la fede terrestre sì. E credetemi, il requisito dell'indipendenza è la pietra angolare del ter.ver. di cui sono persino troppo pigri per scrivere.
 

Scusa, HideYourRichess, ma mi sembra che tu sia uscito dal seminato. Non so più di cosa discutere con voi, visto che insistete così tanto con le sciocchezze. La tua logica di ragionamento

Ни Марков, ни Байес не имеют отношения к ТИ. А тер.вер. имеет.

è completamente incomprensibile per me.

Non ci crederò. Mostrami la fonte che afferma che

La richiesta di indipendenza è la pietra angolare della fede.

Motivazione: