L'apprendimento automatico nel trading: teoria, pratica, trading e altro - pagina 2633

Mikhail Mishanin  

Un approccio o entrambi?

https://habr.com/ru/post/661457/

Датацентрический и моделецентрический подходы в машинном обучении
Датацентрический и моделецентрический подходы в машинном обучении
  • 2022.04.19
  • habr.com
Код и данные — фундамент ИИ-системы. Оба эти компонента играют важную роль в разработке надёжной модели, но на каком из них следует сосредоточиться больше? В этой статье мы сравним методики, ставящие в центр данные , либо модель , и посмотрим, какая из них лучше; также мы поговорим о том, как внедрять датацентрическую инфраструктуру...
Aleksey Nikolayev  
Mikhail Mishanin #:

Un approccio o entrambi?

https://habr.com/ru/post/661457/

A mio parere, una combinazione armoniosa di entrambi gli approcci, tenendo conto delle specificità dei nostri obiettivi. I segnali dovrebbero "catturare" la "fisica" del mercato, e i modelli dovrebbero essere costruiti per aumentare i profitti (piuttosto che la probabilità di avere ragione, per esempio)

Aleksey Nikolayev  

Un po' più di quasi-filosofia. Il compromesso tra bias e varianza limiterà sempre la complessità del modello. Pertanto, non si può mai essere sicuri che il modello funzionerà bene sull'intero set di predittori. Di conseguenza, si pone il compito di determinare un sottoinsieme funzionante di questo modello. Se ho capito bene, questo è esattamente ciò di cui Maxim ha scritto recentemente (su due modelli). È abbastanza in linea con la vecchia idea che "non si dovrebbe cercare di essere sul mercato tutto il tempo".

Sarebbe bello provare a combinare tutto questo in un unico modello. Per esempio, questa idea (Aleksey Vyazmikin ne ha avuta una leggermente simile) - rompiamo ogni predittore in segmenti, il che dà una ripartizione dell'intero set di predittori in cubi multidimensionali. Poi tra tutti questi cubi scegliamo una serie di cubi adatti. Con una grande dimensionalità questo problema sarà combinatoriamente intrattabile, ma possiamo fare per analogia con la foresta casuale - scegliere casualmente insiemi di predittori a bassa dimensionalità. La segmentazione iniziale per ogni predittore può essere fatta dividendo il patrimonio netto (quando le transazioni sono ordinate per un dato predittore piuttosto che per tempo) in pezzi monotoni.

Completare il tutto con la convalida incrociata (in avanti) e tutte le altre cose che si suppone debbano) Probabilmente, non sarà nemmeno del tutto senza senso) Beh, o qualcuno ha già fatto qualcosa del genere.

Mikhail Mishanin  
Maxim Dmitrievsky #:
Cappello. Un guazzabuglio di diversi test statistici

Come argomento di riflessione/comprensione, che

Correlazione != Causazione

1-4.

E fate comunque i vostri test. E così l'articolo è praticamente pubblicità)

Maxim Dmitrievsky  
Mikhail Mishanin #:

Come argomento di riflessione/comprensione, che

Correlazione != Causazione

1-4.

E fate comunque i vostri test. E così l'articolo è praticamente pubblicità)

Chi ha detto che è uguale. Come inventare un'affermazione falsa e poi confutarla
Valeriy Yastremskiy  
mytarmailS #:
Mi chiedo se sia possibile cercare dei modelli nei dati sintetici. Mi spiego - da un piccolo campione di 100-200 osservazioni per trarre dalla loro distribuzione un sacco di dati sintetici e lì già cercare alcune sequenze complesse, ecc.
Non secondo la logica.
Motivazione: