Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 221

 
Andrej Dik:
Wahrscheinlich die vernünftigste und objektivste Meinung zu R, die ich in letzter Zeit gesehen habe. Konventionelles Denken, das ist es, woran alte Fans von R leiden, egal wen man auch aus diesem Forum nimmt, sie denken alle gleich, man kann sie sogar untereinander verwechseln, wenn man nicht auf die Spitznamen achtet, sie argumentieren auf die gleiche Weise.

Bei der Diskussion über R kann man nicht auf Sie verzichten, obwohl überhaupt nicht klar ist, WAS Sie hier tun.

Aber da Sie hier sind, zu Ihrem Beispiel.

Sie haben einen genetischen Algorithmus entwickelt, Sie wissen wie, vielleicht besser als jeder andere auf der Welt.

Ich weiß nicht, wie man genetische Algorithmen schreibt. Und das nicht, weil ich es nicht kann, sondern weil ich es nicht muss.

Lassen Sie mich das erklären.

In einem echten Handelssystem verwende ich die rfe-Funktion (Backtesting von Prädiktoren aus caret). Die Ergebnisse sind nicht sehr gut. Soll ich Ihren genetischen Algorithmus verwenden? Hundertmal nein, denn dasselbe Caret hat die Funktion gaf (Prädiktorenauswahl durch genetischen Algorithmus). Aber außerdem hat caret eine andere Funktion saf (Prädiktorenauswahl durch simulierte Robustheit - annealing), die in MEINEM PROBLEM viel effektiver ist, als der GENETISCHE ALGORITHM. Das Problem in meinen Handelssystemen ist eines, und die Werkzeuge sind drei, wobei die Mühsal, eines durch das andere zu ersetzen, ein Ersatz mit drei Buchstaben ist. Außerdem, und das ist vielleicht das Wichtigste: ALLE DREI FUNKTIONEN SIND MIT ANDEREN FUNKTIONEN VERBUNDEN, DIE ICH BRAUCHE.

Ich habe überhaupt kein Problem damit, einen genetischen Algorithmus zu programmieren. Aber bei der Lösung meiner eigenen Probleme kann ich problemlos verschiedene Algorithmen verwenden, darunter auch einen genetischen. In Wirklichkeit ist das Problem die Auswahl der Prädiktoren, es ist ein rechnerisch umfangreiches Problem und um es zu lösen, gibt es neben dem aufgeführten R eine große Anzahl von Tools, die NICHT in R programmiert sind.

 
J.B.:

Es hängt davon ab, welche Art von Forschung, wenn Studenten Forschung, um die Hausarbeit zu bestehen, dann ja, es ist viel einfacher, eine Funktion aus dem Regal zu nehmen, führen Sie es, und erhalten Sie einen Standard-Bericht mit schönen Grafiken, keine Fragen hier.

Wenn man einen Quant-Ingenieur in einem Finanzbüro recherchiert, der Geld vom Markt nimmt, nicht nur durch Provisionen, oder marktnahe Technologie, sieht die Situation anders aus. In der Regel bauen Sie in den richtigen Büros innerhalb von 5 Jahren Ihre eigene Handelsinfrastruktur auf, in der 95% aller notwendigen Tools vorhanden sind, die bequem verpackt sind und die Sie nicht viel komplizierter als in R.......... verwenden können.

Ja, es ist alles klar, und ich stimme Ihnen zu, aber Sie sprechen von der Produktion, aber hier gibt es keine Quons, und es gibt keine Leute mit einer Infrastruktur, die seit 5 Jahren fertig ist... und bevor diese Infrastruktur geschaffen wurde, gab es eine erste Forschung, das ist der Punkt, an dem die meisten Leute sind, sie suchen nach Ideen, Sie sprechen über die Produktion...

Meiner Meinung nach ist das Schema

1) Suche nach einer funktionierenden Idee

2) Suche nach einer funktionierenden Idee

3) Suche nach einer funktionierenden Idee

4) Verkauf und andere Infrastruktur für die Idee (Produktion)

Jetzt kontrastieren Sie den ersten Punkt mit dem vierten - und das ist eine Art von Täuschung, verstehen Sie, was ich meine?

Nun, für den ersten Punkt, wenn Sie schnell durch einen Haufen von Ideen gehen müssen, ist R eine Sache, für den vierten Punkt ist es natürlich C++.

 

SanSanych Fomenko:

Ich weiß nicht, wie man genetische Algorithmen schreibt. Und das nicht, weil ich es nicht kann, sondern weil ich es nicht muss.

Ich erinnerte mich daran, weil ich beim Vorscreening aufgefordert wurde, eine Sortierblase oder schneller zu schreiben, natürlich ohne im Internet nachzuschauen, ich schrieb es, es schien eine kindische Aufgabe zu sein, aber dann wurde mir gesagt, dass 70 % der Leute das nicht können. Ich denke, dass dies richtig ist, gibt es eine bestimmte Reihe von grundlegenden Algorithmen, die wie 2 + 2 = 4 Spezialist in diesem oder jenem Bereich wissen sollte, wie es stark erhöht, zumindest die Fähigkeit, sie effektiv zu nutzen, nicht zu erwähnen, dass zu ändern und zu schaffen effektivere Analoga. Quantum sollte in der Lage sein, MLP, baes, Knn, forest usw. zu schreiben, ohne zu gucken. Das ist 2+2=4 für Quant.

SanSanych Fomenko:

Ich verwende die Funktion rfe (Rückselektion von Prädiktoren aus caret). Die Ergebnisse sind nicht sehr gut. Es gibt eine Funktion gaf...

Nun ja, das ist genau die Art von Gespräch, das die Verbraucher mit "Zehntausenden von Funktionen" führen, die sie nicht verstehen, aber einfach ausprobieren. Leider ist alles, was sie dir geben, bereits erprobt und es gibt "keinen Fisch dort", vor allem in Bezug auf algotrading, all diese Fülle von Funktionen ist illusorisch, algotrading in seinem Wesen kann nicht poppy sein, müssen Sie in der Lage sein und Liebe zu einer neuen Generation Fahrrad zu erfinden, sonst werden sie dich in einem "fancy car" nur auf eine Müllkippe oder den Friedhof zu nehmen, sind Sie nicht fahren)))

 
mytarmailS:

Ja, es ist alles klar, und ich stimme Ihnen zu, aber Sie sprechen von der Produktion, aber hier gibt es keine Quons, und es gibt keine Leute mit einer Infrastruktur, die seit 5 Jahren fertig ist... und bevor diese Infrastruktur geschaffen wurde, gab es eine erste Forschung, das ist der Punkt, an dem die meisten Leute sind, sie suchen nach Ideen, Sie sprechen über die Produktion...

Meiner Meinung nach ist das Schema

1) Suche nach einer funktionierenden Idee

2) Suche nach einer funktionierenden Idee

3) Suche nach einer funktionierenden Idee

4) Verkauf und andere Infrastruktur für die Idee (Produktion)

Jetzt kontrastieren Sie den ersten Punkt mit dem vierten - und das ist eine Art von Täuschung, verstehen Sie, was ich meine?

Nun, für den ersten Punkt, wenn Sie schnell durch ein Bündel von Ideen gehen müssen, ist R eine Sache, für den vierten Punkt ist es natürlich C++.

Falsches Schema, denn im Algotrading sind viele Prozesse miteinander verflochten und voneinander abhängig. Die Suche nach einer Idee kann nicht losgelöst von den Daten und einem tiefen Verständnis der Algorithmen, die sie verarbeiten, erfolgen. Wenn Sie also zum Beispiel auf der Suche nach Ideen auf den Minuten-Candlesticks eines Währungspaares sind, lautet die Adresse .... Nicht"das eine", das Orderbuch des russischen Marktes ist ein anderes, das Orderbuch von Dutzenden von weltweit führenden Börsen und Anbietern makroökonomischer Daten ist ein anderes, usw. Das Gleiche gilt für die Verarbeitung, die Idee und die Werkzeuge sind eng miteinander verknüpft, der inkrementelle Ansatz ist sinnvoll, aber nicht der "Vakuum"-Ansatz, bei dem eine Idee als Kugelpferd gesucht und mit C++ umgesetzt wird. Wie lässt sich beispielsweise die Ideeder Modellierung von Hochfrequenz-Limit-Orderbuchdynamik mit Support-Vektor-Maschinen Ihrer Meinung nach praktisch umsetzen? Probieren Sie es aus und sagen Sie es mir dann. Ich kann nur sagen, dass es in dem Artikel auch 2+2+4 heißt, aber in Wirklichkeit ist es viel komplizierter.

 
J.B.:

Einmal arbeitete an einem gamediver Büro ein Jahr, erinnerte ich mich an diese, wie es bei der vorläufigen Interview gebeten, eine Sortierung Blase oder schneller zu schreiben, ohne Blick auf das Internet natürlich, schrieb ich, dachte ich, es war kindisch TOR, aber dann wurde ich aufgeklärt, dass 70% der Menschen können es nicht tun. Ich denke, dass dies richtig ist, gibt es eine bestimmte Reihe von grundlegenden Algorithmen, die wie 2 + 2 = 4 Spezialist in diesem oder jenem Bereich wissen sollte, wie es stark erhöht, zumindest die Fähigkeit, sie effektiv zu nutzen, nicht zu erwähnen, dass zu ändern und zu schaffen effektivere Analoga. Quantum sollte in der Lage sein, MLP, baes, Knn, forest usw. zu schreiben, ohne zu gucken. Das ist 2+2=4 für Quant.

Ich will nicht wie ein Nicht-Detektiv klingen, aber es ist irgendwie seltsam, dass ein Profi wie Sie, der dieses Jahr sogar bei der Quantum Foundation gearbeitet hat, nicht weiß, was Kreuzkorrelation isthttps://www.mql5.com/ru/forum/71816

Индикатор опережения\отставания временного ряда
Индикатор опережения\отставания временного ряда
  • www.mql5.com
Индикатор опережения\отставания временного ряда.
 
J.B:

Das ist nicht das richtige Schema, denn beim algorithmischen Handel sind viele Prozesse miteinander verflochten und voneinander abhängig. Die Suche nach einer Idee kann nicht losgelöst von den Daten und einem tiefen Verständnis der Algorithmen zu deren Verarbeitung erfolgen. Wenn Sie also zum Beispiel auf der Suche nach Ideen auf den Minuten-Candlesticks eines Währungspaares sind, lautet die Adresse .... Nicht"das eine", das Orderbuch des russischen Marktes ist ein anderes, das Orderbuch von Dutzenden von weltweit führenden Börsen und Anbietern makroökonomischer Daten ist ein anderes, usw. Das Gleiche gilt für die Verarbeitung, die Idee und die Werkzeuge sind eng miteinander verknüpft, der inkrementelle Ansatz ist sinnvoll, aber nicht der "Vakuum"-Ansatz, bei dem eine Idee als Kugelpferd gesucht und mit C++ umgesetzt wird. Wie lässt sich beispielsweise die Ideeder Modellierung von Hochfrequenz-Limit-Orderbuchdynamik mit Support-Vektor-Maschinen Ihrer Meinung nach praktisch umsetzen? Probieren Sie es aus und sagen Sie es mir dann. Ich kann nur sagen, dass es in dem Artikel auch 2+2+4 ist, in Wirklichkeit ist alles viel komplizierter.

Ich stimme mit hft überein, aber ich verstehe nicht, warum Sie es immer als Beispiel anführen, Sie wissen vielleicht nicht, dass solche Daten unerreichbar sind, keiner der Leute hier hat Geld, um Orderbroker aus dem Westen und schnelle Kanäle zu kaufen.

Warum überhaupt darüber reden und ein Exempel statuieren?

 
mytarmailS:

Ich will nicht wie ein Detektiv klingen, aber es ist seltsam, dass ein Profi wie Sie, der bei einem Quantenfonds arbeitet, dieses Jahr nicht wusste, was Kreuzkorrelation isthttps://www.mql5.com/ru/forum/71816

Ach, komm schon... Ich war damals dabei, ein ziemlich komplexes Problem zu lösen, und saß zu Hause, krank, es war nicht günstig, Kollegen zu fragen, ich hatte einen Monat Zeit, um einen Job zu finden, dann habe ich es selbst herausgefunden, und nach einer Weile Rev. Combinator hat genau die gleiche Lösung genannt. Die andere Frage ist, wenn Sie ein solches Problem konfrontiert, würden Sie wahrscheinlich nicht gelöst haben, weil hier müssen Sie wissen, wie Kreuzkorrelation zwischen den Zeilen auf niedrigen Ebenen implementiert ist und erraten, wie es zu benutzen, R hat keine solche Funktion "lagging Zeile", und vor allem, Sie würden einfach nicht ein solches Problem gesetzt haben)))) Sie sind also kein Quant in einem Hedgefonds.

 

SanSanych Fomenko:


Wenn Sie für die Sprache R als Mittel zur effizienten Lösung von Handelsaufgaben werben, verweisen Sie immer wieder auf die einfache Verwendung ihrer Werkzeuge und die große Bandbreite ihrer Möglichkeiten. Das wird von niemandem bestritten. Aber Ihre Aussagen zeigen deutlich, dass Sie die Grundsätze dieser Sprache nicht kennen.

Natürlich kennen Sie sich mit den Funktionen gut aus und wissen, welche davon für die Lösung Ihrer Aufgaben notwendig sind, aber die Mechanismen, die sich hinter diesen Namen verbergen, sind Ihnen offensichtlich völlig unbekannt. Sie wissen nicht, wie sie funktionieren. Mehr noch: Sie wollen es nicht wissen und halten andere davon ab.

Sie sind ein Benutzer von R. Sie mögen dieses Werkzeug, weil es einfach zu bedienen ist, aber nicht wegen seiner Effizienz bei der Lösung konkreter Aufgaben, von denen Sie nichts wissen und auch nicht wissen wollen.

Verstehen Sie, dass sich ein Entwickler von einem Benutzer gerade dadurch unterscheidet, dass er den Mechanismus verstehen und die maximale Effizienz seiner Funktionsweise erreichen will.

Dieses Ziel kann nur mit absoluter Kenntnis des Themas erreicht werden. Die Leichtigkeit, mit der etwas geschaffen werden kann, ist dabei unerheblich.

Sie laden die Entwickler dazu ein, ihre Aufgabe zu vergessen und zu bloßen Benutzern zu werden. Genießen Sie die Benutzerfreundlichkeit der von Ihnen bereitgestellten Werkzeuge und vergessen Sie völlig, die Grundsätze ihrer Arbeit zu untersuchen.

Bei einem solchen Ansatz kann die Effizienz vergessen werden, und die Entwickler können sie nicht vergessen.

Wenn Sie beginnen, die Funktionsweise der in R verborgenen Mechanismen zu verstehen, werden Sie feststellen, dass sie nicht so perfekt sind, wie sie einem begeisterten Dilettanten erscheinen mögen.

Mit diesem Beitrag versuche ich, einen Standpunkt zu artikulieren, der im Gegensatz zu Ihnen steht, aber ich könnte mich auch in anderen Punkten irren. Aber genau so sehe ich das Problem.

 
mytarmailS:

Ich stimme mit hft überein, aber ich verstehe nicht, warum Sie es immer als Beispiel anführen, Sie wissen, dass solche Daten für niemanden verfügbar sind, niemand hier hat das Geld, um Order-Getter aus dem Westen und schnelle Kanäle zu kaufen.

Warum sollte man darüber sprechen und es als Beispiel anführen?

Verallgemeinern Sie nicht. Sie können mit dem OL auf dem russischen Markt beginnen. Und HFT, wie es nur funktioniert. HFT und Insider.
 
J.B.:

Komm schon... Ich war damals dabei, ein ziemlich komplexes Problem zu lösen, und saß zu Hause, krank, es war nicht günstig, Kollegen zu fragen, ich hatte einen Monat Zeit, um einen Job zu bekommen, dann habe ich es selbst herausgefunden, und nach einer Weile sagte Herr Kombinator genau die gleiche Lösung. Combinator hat genau die gleiche Lösung genannt. Die andere Frage ist, wenn Sie ein solches Problem konfrontiert, würden Sie wahrscheinlich nicht gelöst haben, weil hier müssen Sie wissen, wie Kreuzkorrelation zwischen den Zeilen auf niedrigem Niveau implementiert ist und erraten, wie es zu benutzen, R hat keine solche Funktion "lagging Zeile", und vor allem, würden Sie einfach nicht ein solches Problem gesetzt haben)))) Sie sind also kein Quant in einem Hedgefonds.

Ich bin nicht so dumm, wie du denkst, beachte das Wort Kreuzkorrelation, ich habe es in deinem Zweig gesagt, aber es ist das, was du getan hast, als ich zum ersten Mal etwas über Kreuzkorrelation gelernt habe, hatte ich die gleiche Idee wie du über den Vergleich von Reihen(du bist also nicht allein und nicht einzigartig darin) und das war lange vor deinem Zweig, aber ich bin nie dazu gekommen...

J.B.:
Verallgemeinern Sie nicht. Sie können mit dem OL auf dem russischen Markt beginnen. Und HFT, wie es nur funktioniert. HFT und Insider.

Sie könnten Recht haben.... aber es scheint mir, dass die verfügbaren OLs mit schnellerer Geschwindigkeit als Plaza geschrieben werden, und wird sich herausstellen, dass die auf einem getestet und die Realität wird anders sein, kann ich falsch sein, aber das ist der Eindruck, den ich bekam

Grund der Beschwerde: