Diskussion zum Artikel "Fortschrittliches Resampling und Auswahl von CatBoost-Modellen durch die Brute-Force-Methode" - Seite 9

 
Insgesamt wird etwas besser. Aber 50 Modelle auf jedem Tick in der Produktion zu haben, ist übertrieben
 

Hier ist eine Option für eine schöne Verbesserung


 

Hier ist der Datensatz nach dem Resampling.


 

Ausbildung überall 5 Monate, Validierung 2 Jahre, Prüfung 5 Jahre

alle Karten für 5 Jahre

 

Ein weiteres Mal.

Ja, manchmal macht es Sinn.

Ein bisschen mehr stapeln. Ja, es macht Sinn, zu stapeln. Es ist immer noch eine offene Frage, wie viel.

 
Maxim Dmitrievsky:

Noch einmal.

Nun, ja, manchmal macht es Sinn.

Ein bisschen mehr Stacking. Ja, es macht Sinn, zu stapeln. Es ist immer noch eine offene Frage, wie viel.

Jetzt geht's los. )

Deshalb hat Breiman einen Zufallswald gemacht, keinen besseren.

 
elibrarius:

Jetzt geht's los. )

Das ist der Grund, warum Bryman einen Zufallswald anstelle eines besseren Waldes erstellt hat.

Seltsamerweise tritt der Effekt auf, wenn Accuracy beim Training verwendet wird

Bei anderen Metriken ist er nicht so offensichtlich.

Übrigens gibt es in catbusta eine ganze Reihe von Metriken, und ich zögere, zu fragen, welche davon besser ist
 
Maxim Dmitrievsky:

Interessanterweise tritt der Effekt auf, wenn Accuracy beim Training verwendet wird

bei anderen Metriken ist er nicht so offensichtlich.

Übrigens gibt es in catbusta eine ganze Reihe von Metriken, und ich zögere, zu fragen, welche davon die beste ist

Wenn Accuracy das Gleichgewicht am besten verbessert, ist es offensichtlich die beste.

 
elibrarius:

Wenn Accuracy das Gleichgewicht am besten verbessert, ist es offensichtlich das Beste.

Nein, es gibt welche, die es besser machen.

aber es gibt kein sinnvolles Verständnis.

 
Maxim Dmitrievsky:

Nein, es gibt welche, die besser funktionieren.

Welche?