Cosa inserire nell'ingresso della rete neurale? Le vostre idee... - pagina 76
Ti stai perdendo delle opportunità di trading:
- App di trading gratuite
- Oltre 8.000 segnali per il copy trading
- Notizie economiche per esplorare i mercati finanziari
Registrazione
Accedi
Accetti la politica del sito e le condizioni d’uso
Se non hai un account, registrati
C hat mi ha detto la stessa cosae quando ho posto la domanda: "Se dopo l'addestramento l'input è 1 e l'output è 2, corrisponde alla regola "se l'input è 1, l'output è 2" - anche Dipsic ha dovuto concordare". Sitratta più che altro dell'essenza della scatola. Provate a rispondere alla stessa domanda.
Lungi da me l'idea di "chiacchierare di gpt", tanto meno di "dipsic".
Ad essere onesti, non ho mai interagito con loro (hmmm... forse dovrei iniziare...).
D'altra parte, sono tutt'altro che un professionista in questo caso.
Diciamo, sull'esempio di un perseptron (singolo neurone):
Il concetto non è "se altro", ma "simile" o "dissimile".
L'uscita del perseptron è la somma dei prodotti dei valori di X per i valori di W elemento per elemento.
E se l'immagine X è identica o molto simile all'immagine W (che è stata precedentemente formata durante l'addestramento), allora l'output è il massimo valore possibile nel contesto della "somma dei prodotti di X su W".
A condizione, naturalmente, che nel processo di addestramento le immagini X siano state precedentemente normalizzate all'intervallo da 0 a +1, o all'intervallo da -1 a +1.
Senza tale normalizzazione, non si otterrà un risultato adeguato.
(Tuttavia, esistono altri modi per normalizzare).
In altre parole, se il perseptron "vede" (sugli input X) ciò che gli è stato insegnato (e il suo apprendimento è memorizzato su W), produrrà il risultato più alto sulla somma dei prodotti.
Tuttavia, è sempre possibile SELEZIONARE una tale immagine X, alla cui presentazione il perseptron produrrà un risultato ancora più alto.
Va notato che l'immagine presentata deve essere pre-normalizzata all'intervallo da 0 a +1, o all'intervallo da -1 a +1.
E qui sorgono le domande:
- quale dovrebbe essere esattamente questo "risultato più alto", in base al quale potremmo concludere che il perseptron ha visto esattamente ciò che gli è stato insegnato?
- E si dovrebbe applicare un corridoio di elevatezza, un livello di elevatezza inferiore e un livello di elevatezza superiore, o è sufficiente solo quello inferiore?
In generale, queste domande sono valide sia con che senza la funzione di attivazione.
Evgeny Shevtsov#:
Dove devo andare per "chat-gpt", e ancora di più per "dipsic".
Ad essere onesti, non ho mai comunicato con loro (hmm... forse dovrei iniziare...).
Provate sicuramente, ne vale la pena. https://chat.deepseek.com/ Soprattutto la parte di ragionamento del thread. Dip lo spiega bene come tutor.
E vgeny Shevtsov#:
...
Il concetto non è "se altro" ma "simile" o "dissimile".
...
Vedete, se non avete una soglia, allora non avete un modello. O accettate la soglia, o non ha senso che MLP e altri esistano. Non esiste una cosa come "probabilmente un missile sparato ora da un paese vicino ci colpirà". Oppure no.
L'IA dice 0,694875.... Il modello finale è il processo decisionale. E se avete una soglia di 0,6, allora la vostra IA è una scatola con le regole "se l'input è 0,3 / 0,7 / 0,1 / 0,8, allora l'output è0,694875....", e non c'è altro modo.
E se non avete una soglia, avete un modello di "non so cosa sia questo insieme di numeri, non ho idea a cosa serva".
Ma anche se non si sa cosa sia la casella, essa ha una regola al suo interno:"se l'input è 0,3 / 0,7 / 0,1 / 0,8, l'output è0,694875...".(e non c'è altro modo per aggirarla)
Ho un indicatore di rumore costruito in modo simile
Questo è l'indicatore di rumore più insignificante che non ha nulla a che fare con il rumore nelle serie temporali. Avete una rete dipsic, chiedetegli cos'è il rumore ))
È un'opzione interessante. Non l'ho provata. Risulta che richiede un modello di regressione. Si può provare con la metrica e il quadrato R, o con una modifica - per stimare la dispersione della deviazione da una linea retta....
Io considero il problema in modo diverso: pongo una domanda di classificazione - se il prezzo raggiungerà il punto di SL o di TP, e una variante - se il prezzo raggiungerà lo SL prima che il mercato passi a uno stato diverso (l'inizio del trend) o no. È importante che lo SL sia simile ai punti di riferimento, non solo in termini di pips.
L'aspetto negativo è che il prezzo può muoversi nella giusta direzione all'inizio per un terzo del tempo, per poi scivolare verso il punto di partenza. Se consideriamo che il prezzo si muove da un livello all'altro, questo approccio sembra strano; i modelli dovrebbero essere compresi subito:
1. se un livello significativo sarà raggiunto nell'intervallo di tempo
2. Quanto tempo ci vorrà per raggiungere il livello
3. Cosa succederà dopo il raggiungimento del livello (dipende dalla risposta alla seconda domanda - tempo sufficiente per un pullback o un breakdown dopo un flat).
Quando si raggiunge un livello significativo, è importante valutare il movimento fino a questo livello.
In generale - un paradigma diverso, quale sia il più corretto - può essere determinato attraverso la sperimentazione.
Quale intervallo di tempo utilizzate?
Vorrei anche notare lo svantaggio dell'utilizzo del campionamento continuo - ottenere esempi simili su barre vicine, che possono quantitativamente prevalere in una o nell'altra direzione, dando uno spostamento di probabilità errato, se in seguito non si opera su ogni barra.
Per quanto riguarda la stima dell'R/S, in cui anche l'intervallo di tempo T è direttamente coinvolto:
Credo che il trading debba essere fatto in modo del tutto simile al modo in cui vengono generate le stime stesse.
Cioè, una volta che la rete (consapevolmente addestrata) ha aperto un trade, questo dovrebbe essere forzatamente chiuso dopo l'intervallo di tempo T, dove quest'ultimo può essere chiamato "orizzonte di previsione".
Pertanto, il livello TP è il luogo di chiusura forzata dell'operazione, mentre il livello SL dovrebbe essere posizionato a scopo puramente assicurativo e a una distanza tale da non danneggiare il concetto stesso.
È meglio calcolare l'intervallo di tempo T con candele intere, perché si elimina il problema del calcolo dal venerdì al lunedì, dove c'è un eccesso di tempo di due giorni, se T è stato calcolato con il concetto di tempo, non con le candele.
Il numero di candele T deve essere sostanzialmente più piccolo (di un fattore diverso) della dimensione dell'immagine X utilizzata per addestrare la rete.
Naturalmente, pensare in termini di fattore di profitto (il rapporto tra la distanza TP e la distanza SL, così come il rapporto tra il movimento verso l'alto e il movimento verso il basso, o il rapporto tra il movimento verso il basso e il movimento verso l'alto) come una stima di un'operazione o di un movimento di prezzo è più familiare e comprensibile.
Tuttavia, la stima calcolata in questo modo può essere e sarà significativamente maggiore di uno e fino all'infinito.
Mentre per l'addestramento della rete è necessario fornire stime nell'intervallo da -1 a +1, cosa che è soddisfatta dalla stima R/S.
Ma, ripeto, la stima R/S è ben lontana dall'essere autosufficiente, perché stima la traiettoria solo rispetto a se stessa, ma non stima il movimento R rispetto a qualche movimento più lungo di S.
Il rumore di cui parlavate tu e dipsic non ha nulla a che fare con i prezzi.
A cosa si riferisce?
1) Ai segnali fisici 2) Al contesto:
Sto dicendo cose ovvie. Ma nemmeno quelle sono contenute negli articoli spazzatura del tipo "spazzatura dentro, spazzatura fuori". Anche il contesto non è scomposto, dove, cosa e quando chiamare rumore e dove, quando e come, e soprattutto - perché così - è necessario liberarsene.
Un approccio non migliore del mio punzecchiamento creativo.
Una sezione del grafico in cui altri "neuroni" guadagnano denaro.L'intero grafico è una zona solida di puro segnale. E diventerà "rumoroso" solo se qualcuno ci soffia sopra con il fumo di sigaretta, rompe lo schermo, ecc.