Algoritmo per combinare gli intervalli di un segmento - aiuta a creare - pagina 5

 


)

 
Dmitry Fedoseev:

1. Completamente incomprensibile e già qualcosa di completamente diverso.

Qual è il compito in generale? Qual è lo scopo pratico? Forse è risolto in modo completamente diverso.

Beh, se ti interessa, lascia che te lo dica in modo più dettagliato. Nell'algoritmo di apprendimento automatico CatBoost, l'enumerazione dei valori impostati di una variabile (predittore) ottenuta dalle osservazioni (array) per impostare la divisione è risolta costruendo una pregriglia (quantizzazione), in modo che i numeri siano divisi in intervalli (periodi/intervalli) e l'enumerazione dei valori non avviene su tutti i numeri, ma solo su questi intervalli. Ci sono diversi metodi incorporati per la costruzione di griglie, compresi quelli con diverso numero di limiti desiderati. Visivamente, una variante della griglia appare come nella figura qui sotto dove ogni 100 valori dell'array incrementa il valore sulla scala y di uno - questo mostra la ripetibilità dei valori.

Il compito è quello di costruire una griglia più favorevole per l'apprendimento, cioè una griglia tale in cui l'informazione tra gli intervalli (nel segmento) apparterrà di più a uno degli obiettivi (0/1), pur mantenendo la coerenza della dipendenza e la sufficienza delle osservazioni.

Ora ottengo diverse maglie, seleziono i loro intervalli in base a determinati criteri (ho scritto prima), e ho bisogno di combinare gli intervalli selezionati tra loro per combinarli in un'unica maglia.

 
Aleksey Nikolayev:


)

Se posso aiutare, aiuto, e se non posso, non esito a chiedere aiuto.

Inoltre, i problemi sono stati rari qui intorno ultimamente, e ho pensato che la gente sarebbe stata interessata a partecipare alla loro risoluzione.

 
Aleksey Vyazmikin:

///

Ora ottengo diverse maglie, seleziono i loro segmenti secondo determinati criteri (che ho scritto prima), e ho bisogno di combinare i segmenti selezionati tra loro per combinarli in una maglia.

Ecco su cosa verteva la domanda. Come vuoi fare?

 
Dmitry Fedoseev:

Ecco su cosa verteva la domanda. Come vuoi fare?

Hmmm... quindi lo script che hai scritto può fare quasi tutto il lavoro. Ci sono altre opzioni? Ho suggerito l'opzione di ridurre il numero di combinazioni.


Sto ancora considerando questa opzione :)

Почему амеба справилась с вычислениями лучше современного компьютера
Почему амеба справилась с вычислениями лучше современного компьютера
  • www.popmech.ru
В 2018 году группа исследователей из токийского университета Кейо решила использовать амебу для решения так называемой «задачи коммивояжера», известной в области компьютерных наук проблемы. Суть ее такова: представьте, что вы – путешествующий от города к городу...
 
Aleksey Vyazmikin:

Hmmm... quindi lo script che hai scritto può fare quasi tutto il lavoro. Ci sono altre opzioni? Ho suggerito l'opzione di ridurre il numero di combinazioni.


Sto ancora considerando questa opzione :)

Forse quando ci sono pochi segmenti. E quando ce ne sono molti, come dovrebbe essere?

In che senso ha suggerito l'opzione di ridurre il numero di combinazioni? Non tutte le combinazioni sono sufficienti, o c'è un criterio?

 
Dmitry Fedoseev:

Forse quando ci sono poche sezioni. Ma quando ce ne sono molti, come dovrebbe essere?

In che senso ha suggerito l'opzione di ridurre il numero di combinazioni? Non tutte le combinazioni sono sufficienti, o c'è un criterio?

Quando ce ne sono molti, bisogna pensare...

Come opzione propongo di iniziare con ogni segmento allo stesso modo, ma limitando il numero di combinazioni da ogni punto.

Qui la figura mostra i segmenti sotto forma di un cerchio e la loro valutazione sotto forma di lunghezza della freccia, nella figura solo le due frecce più corte sono selezionate, i restanti "percorsi" sono tagliati fuori (esclusi). Nella forma di queste frecce (grafici in sostanza) ci può essere un coefficiente di valutazione (indicatore).


In questo modo, presumo, non selezioneremo le opzioni peggiori, riducendo il costo del calcolo.
 
Aleksey Vyazmikin:

Quando ce ne sono molti, bisogna pensare...

Come opzione propongo di iniziare con ogni segmento allo stesso modo, ma limitando il numero di combinazioni da ogni punto.

La figura mostra i segmenti sotto forma di un cerchio e la loro valutazione sotto forma di lunghezza della freccia, solo le due frecce più corte sono selezionate nella figura, gli altri "percorsi" sono tagliati fuori (esclusi). Nella forma di queste frecce (grafici in sostanza) ci può essere un coefficiente di valutazione (indicatore).


In questo modo, presumo, non selezioneremo le opzioni peggiori, riducendo il costo di calcolo.
Questo è per la situazione in cui ci sono proporzioni approssimativamente uguali di lunghe e corte e nessuna area con solo segmenti lunghi o corti.
 
Valeriy Yastremskiy:
Questo è per la situazione in cui ci sono proporzioni approssimativamente uguali di percorsi lunghi e corti che lasciano il punto e nessuna area con solo percorsi lunghi o corti.

Che differenza fa se i percorsi sono lunghi o corti, o è una questione di stima (la lunghezza della freccia nell'analogia della figura)?

Abbiamo il desiderio di calpestare i due percorsi migliori nell'esempio, se ce ne sono meno allora c'è solo un percorso.

Per favore, spiega perché questo potrebbe essere un problema.

 

È anche possibile ridurre il numero di combinazioni dividendo i segmenti in segmenti (gruppi) per intervalli.

Nelle figure 4 gruppi con confini di intervallo, fai un'enumerazione solo all'interno dei gruppi, e poi combina le scelte migliori all'interno del gruppo tra gli altri gruppi.

È difficile dividere in modo uniforme, quindi i segmenti per i confini del gruppo possono essere separati e utilizzati quando si combinano i risultati intergruppo.

Motivazione: