Diskussion zum Artikel "Gradient Boosting (CatBoost) für die Entwicklung von Handelssystemen. Ein naiver Zugang" - Seite 7

 
Das ist ein völlig falscher Ansatz. Man kann kein Modell auf der Grundlage desselben Trainings- und Testdatensatzes erstellen und dann sagen, dass es funktioniert, was nutzlos und unbegründet ist. Das nennt man Kurvenanpassung des Modells. Solche Modelle sehen auf dem Papier gut aus, werden aber in der realen Welt niemals funktionieren. Bitte verwenden Sie den richtigen Ansatz für maschinelles Lernen, es gibt mehrere Möglichkeiten, aber Ihre ist völlig falsch.
[Gelöscht]  
Jacob James:
Das ist ein völlig falscher Ansatz. Man kann kein Modell auf der Grundlage desselben Trainings- und Testdatensatzes erstellen und dann sagen, dass es funktioniert, was nutzlos und unbegründet ist. Das nennt man Kurvenanpassung des Modells. Solche Modelle sehen auf dem Papier gut aus, werden aber in der realen Welt niemals funktionieren. Bitte verwenden Sie den richtigen Ansatz für maschinelles Lernen, es gibt mehrere Möglichkeiten, aber Ihre ist völlig falsch.

Ich denke, dass Sie beide völlig falsch liegen, Leute. Das als "naiver Ansatz" bezeichnete Aritkel ist eine Einführung in das CatBoost-Modell. Niemand verbietet Ihnen, das Modell an neuen Daten zu testen. Auch am Ende des Artikels steht: Test mit neuen Daten + Lernphase.

Lesen Sie den Artikel einfach sorgfältiger, denn der nächste Teil ist schon unterwegs.
 
Maxim Dmitrievsky:

Ich muss mir die Augen verbrannt haben, als ich herausfand, was Sie hier tun, obwohl alles so einfach ist, dass es unmöglich ist, aber es ist immer noch schwer, die Gedanken eines anderen wahrzunehmen....

Was soll ich sagen?

1) die Zeichen sind definitiv nicht die besten, es gibt einen großen Spielraum.

2) Es ist nicht notwendig, die Daten vor dem Training des Klassifikators zu mischen (ich habe es überprüft).

3) Was wirklich wertvoll ist, ist das Ziel, es ist das, was den ganzen Artikel ausmacht (ich habe es mit ZZ verglichen, ZZ ist Schrott).


Im Allgemeinen erwies sich der Ansatz zu sein, die folgende - maximal alle "bewegen sich nur um ein gutes Ergebnis auf die Validierung zu erhalten"

Und wir wählen das beste Modell ))))

Und ich habe es geschafft, mich auf diese Weise zu "bewegen".

Aber eigentlich ist es derselbe Weg, von dem ich sprach, als ich die Gewichte der Neuronen optimierte, nur dass ich sofort auf maximalen Gewinn "umzog".

Nun, ich weiß nicht, was ich noch schreiben soll...

[Gelöscht]  
mytarmailS:

Ich muss mir die Augen verbrannt haben, als ich herausfand, was du hier tust, obwohl alles so einfach ist, dass es unmöglich ist, aber es ist trotzdem schwer, die Gedanken eines anderen wahrzunehmen....

Was soll ich sagen?

1) Die Beschilderung ist nicht die beste, es gibt eine große Lücke.

2) Es ist nicht notwendig, die Daten vor dem Training des Klassifikators zu mischen (ich habe es überprüft).

3) Was wirklich wertvoll ist, ist das Ziel, es ist derjenige, der den ganzen Artikel zieht (im Vergleich zu ZZ, ZZ ist Müll).


Im Großen und Ganzen stellte sich der Ansatz wie folgt heraus - wir "verschieben alles so weit wie möglich, nur um ein gutes Ergebnis bei der Validierung zu erhalten".

Und wählen das beste Modell aus ))))

Und ich habe es geschafft, mich auf diese Weise zu "bewegen".

Aber eigentlich ist das dieselbe Methode, von der ich sprach, als ich die Gewichte von neuronkey optimierte, nur dass ich es auf den maximalen Gewinn ausrichtete.

Ich weiß nicht, was ich noch schreiben soll.

Ohne GMM funktioniert das so nicht. Außerdem hast du nicht erkannt, wie kurz das Intervall ist, in dem du trainieren kannst und wie lange das Modell mit neuen Daten lebt. Das ist nicht die Grenze, es gibt Möglichkeiten, die Lebensdauer zu verlängern. Der gesamte Ansatz ist ein organisches EINS, man kann die Teile nicht voneinander trennen.

Ja, Sie können weitere sinnvolle Methoden ausprobieren. Verwenden Sie es, verbessern Sie es

 
Maxim Dmitrievsky:

Ohne GMM funktioniert das so nicht. Außerdem haben Sie nicht überprüft, wie kurz das Intervall ist, in dem Sie trainieren können, und wie lange das Modell mit neuen Daten funktioniert. Das ist nicht die Grenze, es gibt Möglichkeiten, die Lebensdauer zu verlängern. Der gesamte Ansatz ist organisch EINS, man kann die Teile nicht voneinander trennen.

Ja, Sie können sinnvollere Methoden ausprobieren. Verwenden Sie es, verbessern Sie es

Ich werde es morgen mit gmm versuchen.

[Gelöscht]  
mytarmailS:

Ich werde es morgen mit gmm versuchen.

Oh, das ist der Artikel, den du geschrieben hast. Dann ja. Es ist ein Einführungsartikel, um den Leser nicht völlig zu überrumpeln.
 
Maxim Dmitrievsky:
Oh, das ist der Artikel, über den du geschrieben hast. Ja, genau. Es ist ein einleitender Artikel, der den Leser davor bewahren soll, völlig durchzudrehen.

Ja, ich dachte, ich gehe ihn der Reihe nach durch.

 
Im Allgemeinen beginnt das System ohne Shuffle sofort, sich erwartungsgemäß zu entleeren.
[Gelöscht]  
Александр:
Im Allgemeinen beginnt das System ohne Shuffle sofort, sich erwartungsgemäß zu entleeren.

jetzt können Sie zum nächsten Artikel springen

 
Ich habe es benutzt,entweder ich mache es selbst, oder ich benutze das, was Sie zur Verfügung stellen. Es gibt folgende Fehler.