Algorithmus zum Kombinieren von Bereichen eines Segments - Hilfe zum Erstellen - Seite 5

 


)

 
Dmitry Fedoseev:

1. Völlig unverständlich und schon etwas ganz anderes.

Was ist die Aufgabe im Allgemeinen? Was ist das praktische Ziel? Vielleicht wird es ganz anders gelöst.

Nun, wenn Sie daran interessiert sind, möchte ich Ihnen mehr darüber erzählen. Beim CatBoost-Algorithmus für maschinelles Lernen wird die Aufzählung der Werte einer Variablen (Prädiktor), die aus den Beobachtungen (Array) gewonnen werden, um die Aufteilung festzulegen, durch die Erstellung eines Vorrasters (Quantisierung) gelöst, so dass die Zahlen in Intervalle (Perioden/Bereiche) unterteilt werden und die Aufzählung der Werte nicht für alle Zahlen, sondern nur für diese Intervalle erfolgt. Es gibt verschiedene eingebaute Methoden zur Erstellung von Gittern, darunter auch solche mit einer unterschiedlichen Anzahl von Begrenzungen. Optisch sieht eine Variante des Rasters wie in der Abbildung unten aus, bei der alle 100 Werte der Matrix den Wert auf der y-Achse um eins erhöhen - dies zeigt die Wiederholbarkeit der Werte.

Die Aufgabe besteht darin, ein für das Lernen möglichst günstiges Gitter zu erstellen, d. h. ein Gitter, in dem die Informationen zwischen den Intervallen (im Segment) eher zu einem der Ziele (0/1) gehören, wobei die Konsistenz der Abhängigkeit und die Hinlänglichkeit der Beobachtungen gewahrt bleiben.

Nun erhalte ich verschiedene Maschen, wähle ihre Abstände nach bestimmten Kriterien aus (die ich zuvor geschrieben habe), und muss die ausgewählten Abstände miteinander kombinieren, um sie zu einer einzigen Masche zusammenzufügen.

 
Aleksey Nikolayev:


)

Wenn ich helfen kann, helfe ich, und wenn nicht, zögere ich nicht, um Hilfe zu bitten.

Außerdem sind die Probleme hier in letzter Zeit selten geworden, und ich dachte, die Leute wären daran interessiert, sich an ihrer Lösung zu beteiligen.

 
Aleksey Vyazmikin:

///

Nun erhalte ich verschiedene Netze, wähle deren Segmente nach bestimmten Kriterien aus (die ich zuvor geschrieben habe), und ich muss die ausgewählten Segmente miteinander kombinieren, um sie zu einem Netz zusammenzufügen.

Genau darum ging es in der Frage. Wie wollen Sie es machen?

 
Dmitry Fedoseev:

Genau darum ging es in der Frage. Wie wollen Sie es machen?

Hmmm... also kann das Skript, das Sie geschrieben haben, fast die ganze Arbeit erledigen. Gibt es noch andere Möglichkeiten? Ich habe vorgeschlagen, die Anzahl der Kombinationen zu verringern.


Ich erwäge diese Option noch :)

Почему амеба справилась с вычислениями лучше современного компьютера
Почему амеба справилась с вычислениями лучше современного компьютера
  • www.popmech.ru
В 2018 году группа исследователей из токийского университета Кейо решила использовать амебу для решения так называемой «задачи коммивояжера», известной в области компьютерных наук проблемы. Суть ее такова: представьте, что вы – путешествующий от города к городу...
 
Aleksey Vyazmikin:

Hmmm... also kann das Skript, das Sie geschrieben haben, fast die ganze Arbeit erledigen. Gibt es noch andere Möglichkeiten? Ich habe vorgeschlagen, die Anzahl der Kombinationen zu verringern.


Ich erwäge diese Option noch :)

Vielleicht, wenn es nur wenige Segmente gibt. Und wenn es viele sind, wie soll es dann sein?

Inwiefern haben Sie vorgeschlagen, die Anzahl der Kombinationen zu verringern? Nicht alle Kombinationen sind ausreichend, oder gibt es ein Kriterium?

 
Dmitry Fedoseev:

Vielleicht, wenn es nur wenige Abschnitte gibt. Aber wenn es viele sind, wie soll es dann sein?

Inwiefern haben Sie vorgeschlagen, die Anzahl der Kombinationen zu verringern? Nicht alle Kombinationen sind ausreichend, oder gibt es ein Kriterium?

Wenn es viele sind, muss man nachdenken...

Als Option schlage ich vor, mit jedem Segment auf die gleiche Weise zu beginnen, aber die Anzahl der Kombinationen von jedem Punkt aus zu begrenzen.

Hier zeigt die Abbildung Segmente in Form eines Kreises und deren Bewertung in Form einer Pfeillänge, in der Abbildung sind nur die beiden kürzesten Pfeile ausgewählt, die restlichen "Wege" sind abgeschnitten (ausgeschlossen). In Form dieser Pfeile (im Wesentlichen Graphen) kann es einen Bewertungskoeffizienten (Indikator) geben.


Ich gehe davon aus, dass wir auf diese Weise nicht die schlechtesten Optionen auswählen und gleichzeitig die Kosten für die Berechnung reduzieren.
 
Aleksey Vyazmikin:

Wenn es viele sind, muss man nachdenken...

Als Option schlage ich vor, mit jedem Segment auf die gleiche Weise zu beginnen, aber die Anzahl der Kombinationen von jedem Punkt aus zu begrenzen.

Die Abbildung zeigt Segmente in Form eines Kreises und ihre Bewertung in Form einer Pfeillänge, wobei nur die beiden kürzesten Pfeile in der Abbildung ausgewählt sind, die anderen "Wege" sind abgeschnitten (ausgeschlossen). In Form dieser Pfeile (im Wesentlichen Graphen) kann es einen Bewertungskoeffizienten (Indikator) geben.


Ich gehe davon aus, dass wir auf diese Weise nicht die schlechtesten Optionen auswählen und gleichzeitig den Rechenaufwand verringern.
Dies gilt für den Fall, dass es ungefähr gleiche Anteile von langen kurzen und keine Bereiche mit nur langen oder kurzen Segmenten gibt.
 
Valeriy Yastremskiy:
Dies gilt für den Fall, dass der Punkt zu etwa gleichen Teilen von langen und kurzen Wegen verlassen wird und es keine Bereiche gibt, die nur lange oder nur kurze Wege aufweisen.

Macht es einen Unterschied, ob die Wege lang oder kurz sind, oder ist es eine Frage der Schätzung (die Länge des Pfeils in der Analogie der Abbildung)?

Wir haben den Wunsch, die zwei besten Wege im Beispiel zu betreten, wenn es weniger sind, gibt es einen Weg.

Bitte erklären Sie, warum dies ein Problem sein könnte.

 

Es ist auch möglich, die Anzahl der Kombinationen zu reduzieren, indem die Segmente in Segmente (Gruppen) nach Bereichen unterteilt werden.

In den Abbildungen 4 Gruppen mit Bereichsgrenzen, führen Sie eine Aufzählung nur innerhalb der Gruppen durch, und kombinieren Sie dann die beste Auswahl innerhalb der Gruppe mit den anderen Gruppen.

Da es schwierig ist, eine gleichmäßige Aufteilung vorzunehmen, können die Segmente nach Gruppengrenzen getrennt und bei der Kombination der Ergebnisse zwischen den Gruppen verwendet werden.