Ricerca in pacchetti di matrici - pagina 7

 
http://quantquant.com/viewtopic.php?f=7&t=1236
 
zaskok3:
http://quantquant.com/viewtopic.php?f=7&t=1236

A cosa serve questo link? Un breve commento sarebbe utile.

Per esempio: una serie di link a tutorial di R e Python.

Per quanto riguarda il contenuto dei link: avete scovato tutto dal web? O ci sono delle preferenze? Di Python, pyBrain è il più interessante e degno di studio e applicazione. Implementa reti che non sono presenti nei pacchetti R. Non per la discussione, non una critica, solo un'osservazione di passaggio.

Buona fortuna

 
Vladimir Perervenko:

1. Sì.

2. Perché? Ho bisogno di un singolo MT4R.dll che è il gateway per inviare dati a R e ricevere i risultati indietro.

3. A tutti i database esistenti. Non solo, sia Microsoft che Oracle hanno integrato R nei loro database.

4. R implementa varie opzioni di interazione con Matlab, dal semplice scambio di file Matlab all'esecuzione di funzioni Matlab da R. Se avete esperienza e competenza in questo campo, potete implementare un eccellente collegamento Matlab-MTterminal con R.

5. In R sono realizzati i pacchetti per tutte le direzioni di una scienza e di una tecnica e tenendo conto delle ultime conquiste. Potete iniziare da qui.

6. Ce n'è più di uno. Il più comune è ff.

In generale sono sorpreso. Sei in mezzo al nulla. Guarda gli articoli 1 e 2 su questo sito e non capirai molto, ma ti farai un'idea di come funziona il linguaggio.

Sto finendo il secondo articolo sull'apprendimento profondo che spero di inviarvi domani per la revisione e gli esempi saranno allegati agli esperti... Se c'è interesse, penso che scriverò diversi articoli sul livello iniziale (filtraggio, decomposizione, previsione ecc.). E, naturalmente, continuare a scavare sull'apprendimento profondo, soprattutto perché Google ha aperto la sua libreria TensorFlow per tutti. E ce ne sono altri non meno interessanti e promettenti (mxnet, pyBrain).

Se un gruppo di appassionati si riunisce, possiamo organizzare un ramo di utenti del linguaggio R.

Buona fortuna

Buoni articoli! Grazie. Dovrò dare un'occhiata. Ma ho intenzione di provare SVM, GBM, xGBoost invece di NS.
 
Alexey Burnakov:
Buoni articoli! Grazie. Devo preoccuparmi di dare un'occhiata. Ma ho intenzione di provare SVM, GBM, xGBoost invece di NS.
SVM, ada, randomforest. Tutto questo dopo aver fatto esercizio con questi pacchetti a sonagli. E dopo questo, i pacchetti di selezione dei predittori
 
Alexey Burnakov:
Buoni articoli! Grazie. Dovrò dare un'occhiata. Ma ho intenzione di provare SVM, GBM, xGBoost invece di NS.

Provali tutti.

Il mio preferito è randomForest in varie modifiche (il vantaggio principale è che non richiede una pre-elaborazione dell'input. E anche ada - punteggio di qualità molto alto. Entrambi hanno due svantaggi: una curva di apprendimento molto lunga e una forte tendenza al sovrallenamento.

Questo non significa che non dovreste usarli, solo che dovete stare attenti ai fastidi.

Buona fortuna

 
СанСаныч Фоменко:
SVM, ada, randomforest. Tutto questo dopo l'esercizio con questi pacchetti a sonagli. E dopo i pacchetti per la selezione dei predittori
Sam Sanych, ho già fatto abbastanza pratica con questi pacchetti anche al lavoro. ))) Solo xGBoost non l'ha ancora toccato.
 
Vladimir Perervenko:

Provali tutti.

Il mio preferito è randomForest in varie modifiche (il vantaggio principale è che non richiede la pre-elaborazione dei dati di input. Anche ada - punteggio di qualità molto alto. Entrambi hanno due svantaggi: richiedono molto tempo per imparare e sono molto inclini al sovraapprendimento.

Questo non significa che non dovete usarli, ma solo che dovete stare attenti a questi fastidi.

Buona fortuna

Ho una domanda per voi sull'articolo 1. Vedo dal grafico dell'emulazione di trading che l'algoritmo fa operazioni su ogni barra, giusto?

E un'altra domanda. Durante l'addestramento, hai fornito alla macchina anche i dati di ogni barra?

Il punto centrale che differenzia i problemi delle serie temporali dalla maggior parte degli altri problemi statistici è che in una serie temporale, le osservazioni non sono reciprocamente indipendenti. Piuttosto un singolo evento casuale può influenzare tutti i punti dati successivi. Questo rende l'analisi delle serie temporali abbastanza diversa dalla maggior parte delle altre aree della statistica.

A causa di questa non indipendenza, i veri modelli sottostanti i dati delle serie temporali possono essere estremamente difficili da vedere con un'ispezione visiva. Chiunque abbia guardato un tipico grafico di giornale delle medie del mercato azionario vede tendenze che sembrano andare avanti per settimane o mesi. Ma gli statistici che hanno studiato l'argomento concordano sul fatto che tali tendenze si verificano essenzialmente con la stessa frequenza che ci si aspetterebbe per caso, e non c'è praticamente alcuna correlazione tra il movimento di borsa di un giorno e quello del giorno successivo. Se ci fosse una tale correlazione, chiunque potrebbe fare soldi nel mercato azionario semplicemente scommettendo che la tendenza di oggi continuerà domani, e semplicemente non è così facile. Infatti, cumulando quasi tutte le serie di numeri casuali si ottiene un modello che sembra non casuale.

Da:http://node101.psych.cornell.edu/Darlington/series/series1.htm

Il punto, come presumo tu lo capisca, è che un approccio diretto in cui tutti i punti della serie temporale sono coinvolti nell'addestramento (e nei test) crea osservazioni reciprocamente dipendenti, il che in un colpo solo annulla la validità delle conclusioni sui "modelli" trovati. In poche parole, non ci si può fidare dei risultati, anche se tutto il resto è stato fatto correttamente. Creare un campione di osservazioni da una serie temporale che non viola le ipotesi statistiche è quindi archivistico. Molto spesso questo passo è semplicemente ignorato nelle fonti popolari, e le conseguenze sono molto deplorevoli. La macchina non imparerà i modelli.

 
Alexey Burnakov:

Ho una domanda per voi sull'articolo 1. Vedo dal grafico dell'emulazione di trading che l'algoritmo fa operazioni su ogni barra, giusto?

E un'altra domanda. Durante l'allenamento, hai dato alla macchina anche i dati di ogni barra?

Da:http://node101.psych.cornell.edu/Darlington/series/series1.htm

Il punto, come presumo tu lo capisca, è che un approccio diretto in cui tutti i punti della serie temporale sono coinvolti nell'addestramento (e nei test) crea osservazioni reciprocamente dipendenti, che in un colpo solo attraversano la validità delle conclusioni sui "modelli" trovati. In poche parole, non ci si può fidare dei risultati, anche se tutto il resto è stato fatto correttamente. Creare un campione di osservazioni da una serie temporale che non violi le ipotesi statistiche è quindi archivistico. Molto spesso questo passo è semplicemente ignorato nelle fonti popolari, e le conseguenze sono molto deplorevoli. La macchina non imparerà i modelli.

Pomeriggio.

che l'algoritmo fa accordi su ogni bar?

No. L'algoritmo esegue operazioni sui segnali ricevuti sull'ultima barra formata. Forse non capisco la domanda?

Un'altra domanda. Hai alimentato l'Expert Advisor con i dati di ogni barra durante l'allenamento?

Non lo capisco. Vuole spiegare? Cercherò di rispondere.

Buona fortuna

 
Alexey Burnakov:

Ho una domanda per voi sull'articolo 1. Vedo dal grafico dell'emulazione di trading che l'algoritmo fa operazioni su ogni barra, giusto?

E un'altra domanda. Durante l'allenamento, hai dato alla macchina anche i dati di ogni barra?

Da:http://node101.psych.cornell.edu/Darlington/series/series1.htm

Il punto, come presumo tu lo capisca, è che un approccio diretto in cui tutti i punti della serie temporale sono coinvolti nell'addestramento (e nei test) crea osservazioni reciprocamente dipendenti, che in un colpo solo attraversano la validità delle conclusioni sui "modelli" trovati. In poche parole, non ci si può fidare dei risultati, anche se tutto il resto è stato fatto correttamente. Creare un campione di osservazioni da una serie temporale che non violi le ipotesi statistiche è quindi archivistico. Molto spesso questo passo è semplicemente ignorato nelle fonti popolari, e le conseguenze sono molto deplorevoli. La macchina non imparerà i modelli.

L'articolo a cui si riferisce è sulla regressione. Abbiamo a che fare con la classificazione. Sono due grandi differenze...

Continuo a non capire la sua domanda.

Buona fortuna

 
Vladimir Perervenko:

L'articolo a cui si riferisce è sulla regressione. Abbiamo a che fare con la classificazione. Queste sono due grandi differenze...

Continuo a non capire la sua domanda.

Buona fortuna

Una domanda di passaggio a tutti i partecipanti alla discussione. Lavori con i dati delle zecche? Mi sono allontanato dall'analisi delle barre molto tempo fa, lavoro esclusivamente su metodi DSP