L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading

Aleksey Vyazmikin 2024.01.23 10:29 #33871

Maxim Dmitrievsky #:

Perché un gran numero di segni è malvagio? Un grafico interessante tratto da un libro su Kozulu.

Probabilità di trovare lo stesso esempio nel campione di addestramento, a seconda del numero di caratteristiche.

Non è chiaro. Probabilità di trovare lo stesso esempio del campione di addestramento?

[Eliminato] 2024.01.23 10:36 #33872

Aleksey Vyazmikin #:

Nulla è chiaro. Probabilità di trovare dove si trova lo stesso esempio del campione di allenamento?

la stessa riga nel dataset

se si hanno solo 1.000 righe

In linea di massima, se si hanno più di 18 caratteristiche, si sta addestrando un classificatore a ricordare ogni riga, perché non si ripetono neppure

e nell'inferenza causale non è possibile abbinare gli esempi per calcolare le statistiche.

Idee ambiziose!!! Auguri ai titolari del [ARCHIVIO]Qualsiasi domanda da principiante,

mytarmailS 2024.01.23 10:53 #33873

Aleksey Vyazmikin #:

1. Come si ottiene questa matrice? Quali sono i numeri presenti?

2. Sto parlando di regole. Nel mio approccio non mi interessa come e da cosa deriva la regola, ma se la risposta è simile a un'altra nel campione di addestramento, non porta informazioni aggiuntive.

1. qualsiasi valore di caratteristica

2. Vi sorprenderò: a nessuno interessa come sono state create le caratteristiche, tutti valutano le caratteristiche in base alla sola risposta.

mytarmailS 2024.01.23 10:55 #33874

Maxim Dmitrievsky #:

Perché un gran numero di segni è malvagio? Un interessante grafico tratto da un libro su Kozulu.

Probabilità di trovare lo stesso esempio nel campione di addestramento, a seconda del numero di caratteristiche.

Se si hanno più di 14 (e anche 10) caratteristiche, si ottengono molte regole che non possono essere ridotte senza perdite.

Tutto questo all'interno di un modello casuale.

Nei modelli con caratteristiche non strutturate (testo, immagini).

Qualche migliaio di attributi è la norma.

[Eliminato] 2024.01.23 11:00 #33875

mytarmailS #:
Tutto ciò rientra nel campo dell'occasionalità...

Nei modelli con caratteristiche non strutturate (testo, immagini).

Alcune migliaia di attributi sono normali.

All'interno di neuronics si utilizzano algoritmi di compressione efficienti, come sec2sec, quindi anche questo è vero.

mytarmailS 2024.01.23 11:07 #33876

Maxim Dmitrievsky #:

Utilizza algoritmi di compressione efficienti all'interno di neuronics, come sec2sec, quindi è anche corretto.

Se parliamo di testo, nel 95% dei casi utilizza il consueto conteggio delle parole: quante volte una parola si è presentata in una determinata osservazione? 0, 1, 103..

Per fare in modo che la matrice delle caratteristiche occupi meno spazio, viene mantenuta nel formato di "matrice rada", che è favorevole perché il 95% dei valori della matrice sono zeri.

Le immagini sono di convoluzione.

E seq2seq è esotico per un problema raro.

Tutte le domande dei Interessante e umorismo Sulla probabilità ineguale di

[Eliminato] 2024.01.23 11:13 #33877

mytarmailS #:
Se parliamo di testo, nel 95% dei casi viene utilizzato il consueto contatore di parole, come ad esempio: quante volte una parola si è presentata in questa osservazione? 0, 1, 103..

E per rendere la matrice delle caratteristiche meno occupata viene mantenuta nel formato di "matrice rada", che è favorevole perché il 95% dei valori della matrice sono zeri
.

Nelle immagini, la convoluzione.

E seq2seq è esotico per un problema raro.

Sono architetture diverse, torte a strati. È difficile fare un confronto. Stiamo parlando di una normale classificazione o regressione. In questo caso sembra una legge universale.

mytarmailS 2024.01.23 11:39 #33878

Maxim Dmitrievsky #:

Si tratta di altre architetture, di torte a strati. È difficile fare un confronto. Stiamo parlando di classificazione o regressione ordinaria. In questo caso, sembra una legge universale.

È tutta la stessa cosa.

Non sto parlando di neuroni, ma della struttura del feedforward.

----------------------------------------------------------------------

Oh, mi ricordo, si chiama "bagaglio di parole".

Cosa c'è di nuovo, di sconosciuto, di incomprensibile, di complicato?

La stessa tabella di segni + qualsiasi MO

Si tratta di lavorare con dati non strutturati (testo) per poi tradurli in una struttura di parole e poi in qualsiasi altra cosa si voglia.

Qualsiasi domanda da principiante, Metodi per identificare un Laboratorio - analisi statistica

[Eliminato] 2024.01.23 12:07 #33879

mytarmailS #:
È tutto uguale.

Non sto parlando di neuroni, ma della struttura dell'alimentazione del tratto.

----------------------------------------------------------------------

Oh, mi ricordo, si chiama "bagaglio di parole".

Cosa c'è di nuovo, di sconosciuto, di incomprensibile, di complicato?

La stessa tabella di segni + qualsiasi MO

Si tratta di lavorare con dati non strutturati (testo) per poi tradurli in una struttura di parole e quindi in qualsiasi altra cosa si desideri.

Questo è un argomento diverso. Indipendentemente dalla trasformazione, la dimensionalità del vettore di input deve essere inferiore alla soglia specificata, altrimenti non sarà possibile determinare un modello. Quelli categorici hanno probabilmente un limite maggiore alla lunghezza del vettore. Inoltre, bisogna considerare la dipendenza dal numero di righe. Su dati enormi, il numero di caratteristiche può essere maggiore.

Cos'è una tendenza? Articolo: Previsione dei prezzi Il mio approccio. Il

mytarmailS 2024.01.23 12:15 #33880

Maxim Dmitrievsky #:
La questione è diversa. Indipendentemente dalla loro trasformazione, la dimensionalità del vettore di ingresso deve essere inferiore alla soglia specificata, altrimenti non è possibile rilevare un modello. Quelli categorici hanno probabilmente un limite maggiore alla lunghezza del vettore. Inoltre, bisogna tenere conto della dipendenza dal numero di righe. Su dati enormi, il numero di caratteristiche può essere maggiore.

Che altro)))

Tutto il mondo lo fa e tutti sono felici))

L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 3388