Cosa inserire nell'ingresso della rete neurale? Le vostre idee... - pagina 62

Ti stai perdendo delle opportunità di trading:
- App di trading gratuite
- Oltre 8.000 segnali per il copy trading
- Notizie economiche per esplorare i mercati finanziari
Registrazione
Accedi
Accetti la politica del sito e le condizioni d’uso
Se non hai un account, registrati
Torniamo all'implementazione tecnica...
L'ottimizzazione è presente quando si seleziona una divisione nell'albero.
Esistono diverse formule per questa operazione. In caso di formazione ad albero al 100%, questa ottimizzazione determina solo il percorso di apprendimento dei dati assoluti. Non influisce sulla qualità dell'apprendimento, che è del 100%. Il vero apprendimento è inteso solo come apprendimento al 100%.
Pertanto, l'apprendimento (memorizzazione esatta di ciò che viene insegnato) = ottimizzazione. Ma se si effettua un sottoallenamento, ossia si interrompe la suddivisione prima della memorizzazione completa, ci si può fermare a diverse varianti di questo percorso: il modello e la qualità dell'apprendimento (grado di sottoallenamento) saranno diversi con diversi algoritmi di selezione delle suddivisioni, diversa profondità di apprendimento, diverso numero di esempi nel foglio di lavoro.
Il sotto-addestramento è una cattiva idea nel caso di insegnamento di dati non ambigui/esatti (tabella di moltiplicazione, legge di Ohm, ecc.). Più esempi si danno da memorizzare/imparare, più precisa sarà la risposta su nuovi dati.
Ma nella situazione dei dati di mercato, per non memorizzare il rumore è necessario fermarsi prima, valutare e selezionare uno di questi modelli non appresi. Di conseguenza, risulta che l'ottimizzazione e la valutazione sono necessarie per i modelli non appresi/non migliorati. Un database perfettamente accurato non ha bisogno di valutazione, ha già tutto quello che voleva per addestrarsi.
L'apprendimento è un processo, non un risultato.
Non può esistere il 100% o il 50% di apprendimento. Non esistono categorie di questo tipo.
La qualità dell'apprendimento si verifica solo attraverso la convalida e la verifica di come lo studente ha appreso le lezioni. Non si verifica se gli allievi ripetono semplicemente dopo l'insegnante o leggono i loro appunti.
La capacità di apprendere e memorizzare è diversa per tutti i modelli, non riducete tutto ad alberi e foreste.
Ed è qui che avviene la magia, quando lo studente (modello) più stupido è spesso un predittore migliore di quello più intelligente. È proprio come nella vita. E c'è una logica che lo giustifica.
Tutto questo è scritto nella teoria dell'apprendimento automatico, che nessuno qui ha mai sentito nominare, anche se è la base dei fondamenti.
C'è della magia nel mondo del MO, ma non tutte le vostre sciocchezze.Questa è una sezione di ottimizzazione sulla minimizzazione di una funzione rumorosa. Ottimizzazione di una funzione rumorosa o qualcosa di simile, scrivo a memoria.
Torniamo all'implementazione tecnica...
L'ottimizzazione è presente quando si seleziona una divisione nell'albero.
Esistono diverse formule per questa operazione. In caso di formazione ad albero al 100%, questa ottimizzazione determina solo il percorso di apprendimento dei dati assoluti. Non influisce sulla qualità dell'apprendimento, che è del 100%. Il vero apprendimento è inteso solo come apprendimento al 100%.
Pertanto, l'apprendimento (memorizzazione esatta di ciò che viene insegnato) = ottimizzazione. Ma se si effettua un sottoallenamento, ossia si interrompe la suddivisione prima della memorizzazione completa, ci si può fermare a diverse varianti di questo percorso: il modello e la qualità dell'apprendimento (grado di sottoallenamento) saranno diversi con diversi algoritmi di selezione delle suddivisioni, diversa profondità di apprendimento, diverso numero di esempi nel foglio di lavoro.
Il sotto-addestramento è una cattiva idea nel caso di insegnamento di dati monovalenti/esatti (tabella di moltiplicazione, legge di Ohm, ecc.). Più esempi si forniscono per la memorizzazione/apprendimento, più precisa sarà la risposta su nuovi dati.
Ma nella situazione dei dati di mercato, per non memorizzare il rumore è necessario fermarsi prima, valutare e selezionare uno di questi modelli non appresi. Di conseguenza, risulta che l'ottimizzazione e la valutazione sono necessarie per i modelli non appresi/non migliorati. Un database perfettamente accurato non ha bisogno di valutazione, ha già tutto quello che voleva per addestrarsi.
Non è così. L'accuratezza delle risposte su nuovi dati (e per nuovi dati intendiamo dati diversi da quelli di addestramento) dipenderà dalle proprietà di ogni particolare modello, non dal numero di esempi di addestramento.
Se consideriamo il caso di dati regolarizzati. Una tabella di moltiplicazione, per esempio. Più esempi si forniscono, più accurate saranno le risposte sui nuovi dati.
I nuovi dati non devono essere completamente diversi, ma compresi tra gli esempi di addestramento. In altre parole, l'interpolazione andrà più o meno bene. 1 albero fornirà l'esempio di addestramento più vicino. Se per altri dati si intendono dati al di fuori dei confini dei dati di addestramento, questa è già un'estrapolazione. L'albero fornirà un esempio estremo, perché è il più vicino.
Se consideriamo i dati di mercato, con un valore elevato di rumore, qualsiasi picco del modello vero sarà mescolato con i picchi del rumore e dobbiamo in qualche modo scegliere il picco vero e non quello del rumore. Le vostre affermazioni sono corrette.
Se consideriamo il caso di dati strutturati. Le tabelle di moltiplicazione, ad esempio. Più esempi si forniscono, più precise saranno le risposte sui nuovi dati.
I nuovi dati non devono essere completamente diversi, ma compresi tra gli esempi di addestramento. In altre parole, l'interpolazione andrà più o meno bene. 1 albero fornirà l'esempio di addestramento più vicino. Se per altri dati si intendono dati al di fuori dei confini dei dati di addestramento, questa è già un'estrapolazione. L'albero fornirà l'esempio più esterno, perché è il più vicino.
Se consideriamo i dati di mercato, con un valore elevato di rumore, qualsiasi picco del modello vero sarà mescolato con i picchi del rumore e dobbiamo scegliere in qualche modo il picco vero e non quello del rumore. Le vostre affermazioni sono corrette.
Non sappiamo nulla dell'assenza o della presenza di pattern. Stiamo solo facendo l'addestramento e parlando dello stesso.
Parliamo dell'approccio comune e del suo significato(magia). La magia dell'apprendimento è controintuitiva per le persone comuni, perché non riescono a capirla:)
Perché è importante non sovrallenarsi, perché è importante non sottoallenarsi. Perché è importante ridurre il numero di tratti e di parametri. ecc. ecc.Esprimete il seguente pensiero:
Entrambe sono formazione. Nel primo caso, si insegna una regola/una legge. Nel secondo caso si apprendono le risposte del primo.
Naturalmente, l'insegnamento di regole, formule e leggi è più efficace, perché con una piccola formula si possono ottenere milioni di risposte senza memorizzarle.
Qui sul forum ci sono state discussioni sulle leggi del mercato e sui grails. Forse c'è una legge, ma il rumore si sovrappone ad essa(
Entrambi sono addestramento. Nel primo caso, viene insegnata una regola/legge. Nel secondo caso si imparano le risposte del primo caso.
Naturalmente, l'insegnamento di regole, formule, leggi è più efficace, perché possedendo una piccola formula si possono ottenere milioni di risposte senza memorizzarle.
Qui sul forum ci sono state discussioni sulle leggi del mercato e sui grails. Forse c'è una legge, ma il rumore si sovrappone ad essa(
Di nuovo il rumore. Tutti parlano di rumore. Ma come possiamo definire il rumore se non conosciamo le regole e le leggi? E se ogni tick fosse una componente di regole e leggi e il problema fosse l'incapacità delle architetture di decifrare il "codice" di un grafico?
Sembra un postulato (l'idea del rumore in un grafico di prezzo).
L'addestramento richiede un materiale di addestramento corretto. I MOE moderni sono troppo buoni per lamentarsi.
Il MOE con un insegnante non implica affatto la ricerca di modelli scarsi nei dati. Richiede che siano presenti in quantità significative nel campione di allenamento.
Se consideriamo il caso di dati strutturati. Le tabelle di moltiplicazione, ad esempio. Più esempi si forniscono, più precise saranno le risposte sui nuovi dati.
I nuovi dati non devono essere completamente diversi, ma compresi tra gli esempi di addestramento. In altre parole, l'interpolazione andrà più o meno bene. 1 albero fornirà l'esempio di addestramento più vicino. Se per altri dati si intendono dati al di fuori dei confini dei dati di addestramento, questa è già un'estrapolazione. L'albero fornirà l'esempio più esterno, perché è il più vicino.
Se consideriamo i dati di mercato, con un valore elevato di rumore, qualsiasi picco del modello vero sarà mescolato con i picchi del rumore e dobbiamo scegliere in qualche modo il picco vero e non quello del rumore. Le vostre affermazioni sono corrette.
I van Butko #:
Di nuovo il rumore. Tutti parlano di rumore, ma come possiamo definire il rumore se non conosciamo le regole e le leggi? E se ogni tick fosse un componente di regole e leggi e il problema fosse l'incapacità delle architetture di decifrare il "codice" di un grafico?
Sembra un postulato (l'idea del rumore in un grafico di prezzo).
A proposito di rumore e modelli
Non è noto quale sia la presenza e la quantità di rumore nei dati di mercato, né se e in che misura esistano modelli.
Informazioni sull'apprendimento, la memorizzazione e la conservazione
Conservazione - Se i dati vengono semplicemente scritti su variabili senza valutarne la qualità, si può parlare di conservazione. Un esempio è la normale scrittura di dati in variabili (database, tabella, matrice, ecc.).
Memorizzazione: se la valutazione della qualità viene effettuata durante il processo di salvataggio, si tratta già di memorizzazione. Ad esempio, la stima della percentuale di risposte corrette rispetto al numero di domande da memorizzare. In questo caso, più sono gli esempi, più ampio è il campo di applicazione possibile. Ad esempio, per un compito 2 x 8 la risposta sarebbe 16, ma per 18 x 67 la risposta potrebbe essere qualsiasi cosa, poiché questa domanda non è stata inclusa negli esempi.
Apprendimento: con la valutazione della qualità è possibile apprendere dai dati memorizzati e memorizzati. L'addestramento è il processo di formazione delle regole per l'elaborazione dei dati memorizzati. Ad esempio, esercitarsi nell'applicazione della regola della moltiplicazione per colonna. In questo caso è necessario ricordare solo le informazioni minime necessarie (tabella di moltiplicazione) e utilizzando la regola della colonna è possibile moltiplicare qualsiasi combinazione di numeri, compresi 18 x 67 e persino 1,657875 x 3,876754.
Un esempio di apprendimento potrebbe essere rappresentato da modelli simili a GPT che non solo memorizzano i dati, ma applicano anche regole per elaborare dati diversi eseguendo calcoli come la moltiplicazione in colonna.
Ora, dopo aver affrontato i concetti di apprendimento, memorizzazione e conservazione, possiamo porci la domanda: in quali ambiti dell'apprendimento automatico (che non coinvolgono modelli di tipo GPT) l'apprendimento viene applicato per analizzare i dati di mercato?
P.S. Questa è roba di base, in seguito passeremo all'importanza della valutazione e ad altri aspetti interessanti.
P.P.S. Sovrapprendimento , sottoapprendimento e stati simili non possono essere valutati né quantitativamente né qualitativamente, quindi non ha molto senso parlarne in modo significativo e pregnante.