Discussione sull’articolo "Le foreste casuali prevedono le tendenze" - pagina 3

 
È redditizio al momento?
 
fozi:
Al momento è redditizio?

L'esempio riportato nell'articolo è dimostrativo, estremamente ridondante.

Se parliamo di foreste casuali in particolare e dell'applicazione di modelli di apprendimento automatico in generale (le reti neurali appartengono a questa classe di algoritmi), essi sono ampiamente utilizzati nel trading.

PS. Ci sono molti sostenitori delle NS sul forum. Quindi questi non sono gli algoritmi più efficienti per il trading. Le foreste casuali sono molto più efficienti.

 
faa1947:

L'esempio riportato nell'articolo è di natura dimostrativa, estremamente ridondante.

Se parliamo di foreste casuali in particolare e dell'applicazione di modelli di apprendimento automatico in generale (le reti neurali appartengono a questa classe di algoritmi), essi sono ampiamente utilizzati nel trading.

PS. Ci sono molti sostenitori delle NS sul forum. Quindi questi non sono gli algoritmi più efficienti per il trading. Le foreste casuali sono molto più efficaci.

Dove sei stato?

È da un po' che non ci si sente?

 
Vinin:

Dove sei stato?

È da un po' che non ti si sente?

No, ero qui, solo che non ho partecipato, e poi mi è venuta un po' di grafomania. Ho scritto un articolo e riassunto alcuni risultati del mio lavoro sotto forma di libro, non scrivevo nulla da molto tempo.
 

Avete qualche link a materiale più approfondito?

 
Smart14:

Avete dei link a materiale più dettagliato?

C'è molta letteratura su questo argomento, soprattutto in inglese.

Ho scritto un libro "Predicting Trends", in cui i problemi di classificazione sono discussi in modo molto più dettagliato rispetto all'articolo. Il libro contiene traduzioni letterali di documentazione tecnica (circa il 30%), esempi di utilizzo di modelli di classificazione sul mercato Forex (circa il 20% del testo) e spiegazioni sull'ideologia della costruzione di modelli di classificazione. Descrive inoltre la sequenza di passi per costruire un Expert Advisor basato su modelli di classificazione.

Maggiori dettagli in allegato.

PS. Il libro contiene un elenco piuttosto esteso di letteratura sull'argomento.

File:
PredictTrend.zip  858 kb
 

vlad19492014.11.23 15:

Caro Vlad!

Tutte le argomentazioni sull'efficienza degli algoritmi di apprendimento automatico hanno senso a una condizione: il modello non viene riaddestrato. Nella mia pratica, è molto difficile ottenere un modello non addestrato. in particolare in questo articolo, si tratta di un modello sovrallenato.

L'overtraining del modello si verifica a causa di un insieme errato di predittori, in cui l'intero cane è sepolto. Pertanto, tutti gli sforzi dovrebbero essere diretti alla selezione dei predittori e poi al modello.

Mi sembra di essere riuscito a trovare segni formali dell'idoneità dei predittori per una particolare variabile target. Se siete interessati a questo, sarò lieto di discuterne in privato.

 
faa1947:

vlad19492014.11.23 15:

Caro Vlad!

Tutte le argomentazioni sull'efficienza degli algoritmi di apprendimento automatico hanno senso a una condizione: il modello non viene riaddestrato. Nella mia pratica, è molto difficile ottenere un modello non addestrato. in particolare in questo articolo, si tratta di un modello sovrallenato.

L'overtraining del modello si verifica a causa di un insieme errato di predittori, in cui l'intero cane è sepolto. Pertanto, tutti gli sforzi dovrebbero essere diretti alla selezione dei predittori e poi al modello.

Mi sembra di essere riuscito a trovare segni formali dell'idoneità dei predittori per una particolare variabile target. Se siete interessati a questo, sarò lieto di discuterne in privato.

тттттттттттттттттттттттттттттттттттттттттттттттттттттттттттттттттттттттттттт

Certo che sono interessato. Scrivere

 

vlad19492014.11.23 15:

http://a ppliedpredictivemodeling.com/blog/2014/11/11/some-thoughts-on-do-we-need-hundreds-of-classifiers-to-solve-real-world-classification-problems

Ho pubblicato questo link con annotazioni sul mio blog. Nessuno era interessato. Ecco l'articolo stesso

 
faa1947:

Il sovrallenamento del modello si verifica a causa di un insieme sbagliato di predittori, in cui l'intero cane è sepolto. Pertanto, tutti gli sforzi devono essere diretti alla selezione dei predittori e poi al modello.

Il modello e la selezione dei predittori sono interrelati. In primo luogo, si dovrebbe selezionare un modello e poi selezionare i predittori basati su questo modello, vagliando con lo stesso modello i predittori che hanno la minore "utilità" nella predizione. Anche se molti articoli e libri di testo insegnano il contrario: per prima cosa si selezionano i predittori utilizzando un metodo per calcolare la relazione tra questi predittori e la serie target - l'output. I metodi più comuni di selezione sono il coefficiente di correlazione tra i predittori e l'output e la mutua informazione. Quindi viene selezionato un modello, di solito non correlato al modo in cui sono stati selezionati i predittori. Se ci pensate (e i libri di testo di econometria non ve lo diranno, dovete pensarci da soli), il metodo di selezione dei predittori in base al coefficiente di correlazione con l'output seleziona essenzialmente i predittori che avranno l'errore minore in un modello di regressione lineare (LRC). Il metodo di selezione dei predittori in base alla loro informazione reciproca con l'output seleziona essenzialmente i predittori che daranno l'errore minore nel modello basato sulla regressione di Nadaraya-Watson (nome astruso GRNN).

Применение метода собственных координат к анализу структуры неэкстенсивных статистических распределений
Применение метода собственных координат к анализу структуры неэкстенсивных статистических распределений
  • 2012.06.21
  • MetaQuotes Software Corp.
  • www.mql5.com
Центральной проблемой прикладной статистики является проблема принятия статистических гипотез. Долгое время считалось, что эта задача не может быть решена. Ситуация изменилась с появлением метода собственных координат. Это очень красивый и мощный инструмент структурного исследования сигнала, позволяющий увидеть больше, чем доступно методами современной прикладной статистики. В статье рассмотрены вопросы практического использования данного метода и приведены программы на языке MQL5. Рассмотрена задача идентификации функций на примере распределения, полученного Хилхорстом и Шером.