Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 221

 
Andrey Dik:
Probablemente la opinión más sensata y objetiva de R que he visto últimamente. Pensamiento convencional eso es lo que padecen los viejos fans de R, cojas a quien cojas incluso de este foro, todos piensan igual, incluso puedes confundirlos entre ellos si no es para mirar los nicks, razonan igual.

Cuando se habla de R es imposible prescindir de ti, aunque no está nada claro QUÉ haces aquí.

Pero ya que estás aquí, en tu ejemplo.

Has desarrollado un algoritmo genético, sabes cómo, quizás mejor que nadie en el mundo.

No sé cómo escribir algoritmos genéticos. Y esto no es porque no pueda hacerlo, sino porque no lo necesito.

Déjeme explicarle.

En un sistema de trading real utilizo la función rfe (backtesting de predictores de caret). No da muy buenos resultados. ¿Debo utilizar su algoritmo genético? Cien veces no, porque el mismo caret tiene función gaf (selección de predictores por algoritmo genético). Pero además caret tiene otra función saf (selección de predictores por robustez simulada - annealing), que es mucho más efectiva en MI PROBLEMA, que el ALGORITMO GENÉTICO. El problema en mis sistemas de comercio es uno, y las herramientas son tres, siendo la laboriosidad de sustituir una por otra una sustitución de tres letras. Además, y quizá lo más importante: las tres funciones están conectadas con otras funciones que necesito.

No tengo el problema de programar un algoritmo genético en absoluto. Pero cuando resuelvo mis propios problemas, puedo utilizar fácilmente varios algoritmos, incluido el genético. En realidad el problema es la selección de predictores, es un problema computacionalmente capacitado y para resolverlo además del R listado hay un gran número de herramientas que se programan NO en R.

 
J.B:

Depende del tipo de investigación, si se trata de una investigación para aprobar el trabajo de fin de curso, entonces sí, es mucho más fácil coger una función de la estantería, ejecutarla y obtener un informe estándar con bonitos gráficos, aquí no hay preguntas.

Si se investiga a un ingeniero cuántico, en una oficina financiera que toma dinero del mercado, no sólo a través de comisiones, o tecnología cercana al mercado, la situación es diferente. Por regla general, en las oficinas adecuadas, en 5 años se construye una infraestructura propia de comercio, donde hay un 95% de todas las herramientas necesarias, que están convenientemente envueltas y se pueden utilizar no mucho más complicadas que en R..........

Sí está todo claro y estoy de acuerdo contigo, pero estás hablando de producción, pero aquí no hay quones, ni gente con infraestructura que se haya hecho durante 5 años... y antes de hacer esta infraestructura hubo una investigación inicial, ahí es donde la mayoría de la gente está, está buscando ideas, estás hablando de la producción...

Como yo lo veo, el esquema es

1) búsqueda de una idea de trabajo

2) búsqueda de una idea de trabajo

3) búsqueda de una idea de trabajo

4) realizar ventas y otras infraestructuras para la idea (producción)

Ahora estás contrastando el primer punto con el cuarto - y es una especie de farsa, ¿sabes lo que quiero decir?

bueno, para el primer punto, cuando necesitas pasar rápidamente por un montón de ideas R es una cosa, para el cuarto punto es c++ naturalmente.

 

SanSanych Fomenko:

No sé cómo escribir algoritmos genéticos. Y no porque no pueda hacerlo, sino porque no lo necesito.

Lo recordé porque en la preselección allí me pidieron que escribiera una burbuja de clasificación o más rápido, sin buscar en internet por supuesto, lo escribí, me pareció una tarea infantil, pero luego me dijeron que el 70% de la gente no puede hacerlo. Creo que esto es correcto, hay un cierto conjunto de algoritmos básicos que deben saber como 2 + 2 = 4 especialista en esta o aquella área, ya que aumenta en gran medida, al menos la capacidad de utilizarlos con eficacia, por no hablar de que para modificar y crear análogos más eficaces. Quantum debería ser capaz de escribir MLP, baes, Knn, forest, etc. sin mirar. Eso es 2+2=4 para quant.

SanSanych Fomenko:

Utilizo la función rfe (selección posterior de predictores a partir de caret). No da muy buenos resultados. Hay una función gaf...

Pues sí, es justo el tipo de conversación que tienen los consumidores con "decenas de miles de funciones" que no entienden, pero lo intentan. Desgraciadamente todo lo que te dan ya está probado y no hay "ningún pez ahí", sobre todo en lo que respecta al algotrading, toda esta riqueza de funciones es ilusoria, el algotrading en su esencia no puede ser amapola, aquí hay que ser capaz y amar reinventar la rueda, de lo contrario te llevarán en un "coche de lujo" sólo a un vertedero o al cementerio, no a ti que lo conduces))

 
mytarmailS:

Sí está todo claro y estoy de acuerdo contigo, pero estás hablando de producción, pero aquí no hay quones, ni gente con infraestructura que se haya hecho durante 5 años... y antes de que se hiciera esta infraestructura hubo una investigación inicial, ahí es donde la mayoría de la gente está, está buscando ideas, estás hablando de la producción...

Como yo lo veo, el esquema es

1) búsqueda de una idea de trabajo

2) búsqueda de una idea de trabajo

3) búsqueda de una idea de trabajo

4) realizar ventas y otras infraestructuras para la idea (producción)

Ahora estás contrastando el primer punto con el cuarto - y es una especie de farsa, ¿sabes lo que quiero decir?

Bueno, para el primer punto, cuando necesitas pasar rápidamente por un montón de ideas R es una cosa, en el cuarto punto es c++ naturalmente.

Esquema erróneo, ya que en algotrading muchos procesos están entrelazados y son interdependientes. No se puede buscar una idea aislada de los datos y de un conocimiento profundo de los algoritmos que los procesan. Así, por ejemplo, "buscar ideas" en velas de minutos de un par de divisas, es.... Nada"uno", en el libro de órdenes del mercado ruso es otro, en el libro de órdenes de decenas de bolsas y proveedores de datos macroeconómicos líderes en el mundo es otro, etc. Lo mismo ocurre con el procesamiento, la idea y las herramientas están estrechamente interrelacionadas, el enfoque incremental tiene sentido, pero no el "vacío", cuando se busca una idea como un caballo esférico y se implementa con C++. Por ejemplo, ¿cómo cree que será conveniente aplicar la ideade modelar la dinámica de la cartera de pedidos de alta frecuencia con máquinas de vectores de apoyo? Pruébalo y luego me cuentas. Sólo puedo decir que en el artículo también es 2+2+4 pero en la realidad es mucho más complicado.

 
J.B:

Una vez trabajó en una oficina gamediver un año, me acordé de esto, ya que en la entrevista preliminar pidió que escribiera una burbuja de clasificación o más rápido, sin mirar a Internet, por supuesto, escribí, pensé que era infantil TOR, pero luego me iluminó que el 70% de las personas no pueden hacerlo. Creo que esto es correcto, hay un cierto conjunto de algoritmos básicos que deben saber como 2 + 2 = 4 especialista en esta o aquella área, ya que aumenta en gran medida, al menos la capacidad de utilizarlos con eficacia, por no hablar de que para modificar y crear análogos más eficaces. Quantum debería ser capaz de escribir MLP, baes, Knn, forest, etc. sin mirar. Eso es 2+2=4 para quant.

No quiero sonar como un no-detective, pero es un poco raro que un profesional como tú, e incluso trabajando en la fundación cuántica este año, no supiera lo que es la correlación cruzadahttps://www.mql5.com/ru/forum/71816

Индикатор опережения\отставания временного ряда
Индикатор опережения\отставания временного ряда
  • www.mql5.com
Индикатор опережения\отставания временного ряда.
 
J.B:

No es el esquema correcto, porque en el comercio algorítmico muchos procesos están entrelazados y son interdependientes. No se puede buscar una idea aislada de los datos y de un conocimiento profundo de los algoritmos para procesarlos. Así, por ejemplo, "buscar ideas" en velas de minutos de un par de divisas, es.... Nada"uno", en el libro de órdenes del mercado ruso es otro, en el libro de órdenes de decenas de bolsas y proveedores de datos macroeconómicos líderes en el mundo es otro, etc. Lo mismo ocurre con el procesamiento, la idea y las herramientas están estrechamente interrelacionadas, el enfoque incremental tiene sentido, pero no el "vacío", cuando se busca una idea como un caballo esférico y se implementa con C++. Por ejemplo, ¿cómo cree que será conveniente aplicar la ideade modelar la dinámica de la cartera de pedidos de alta frecuencia con máquinas de vectores de apoyo? Pruébalo y luego me cuentas. Sólo puedo decir que en el artículo también es 2+2+4, en la realidad todo es mucho más complicado.

Estoy de acuerdo con lo de hft, pero no entiendo por qué siempre lo citáis como ejemplo, quizá no sepáis que esas fechas están fuera del alcance de uno, ninguno de los que están aquí tiene dinero para comprar corredores de órdenes de Occidente y canales rápidos.

¿Por qué hablar de ello y ponerlo como ejemplo?

 
mytarmailS:

No quiero parecer un detective, pero es extraño que un profesional como tú, que trabaja en un fondo cuántico, no supiera lo que es la correlación cruzada este añohttps://www.mql5.com/ru/forum/71816

Oh, vamos... Entonces estaba resolviendo un problema bastante complejo, y estaba sentado en casa, enfermo, no era conveniente preguntar a los colegas, tenía un mes para conseguir un trabajo, entonces lo resolví yo mismo, y después de un tiempo Rev. Combinator nombró exactamente la misma solución. La otra cuestión es que si te enfrentaras a un problema así, probablemente no lo habrías resuelto, porque aquí necesitas saber cómo se implementa la correlación cruzada entre filas en niveles bajos y adivinar cómo usarla, R no tiene esa función "fila retrasada", y lo más importante, simplemente no habrías planteado ese problema)))) Así que no eres un quant en un fondo de cobertura.

 

SanSanych Fomenko:


Al promocionar el lenguaje R como medio para resolver eficazmente las tareas comerciales, se menciona constantemente la facilidad de uso de sus herramientas y la amplia gama de sus capacidades. Nadie lo discute. Pero sus declaraciones muestran claramente su ignorancia de los principios de esta lengua.

Por supuesto, usted es un buen navegante de sus funciones, y sabe cuáles son necesarias para resolver sus tareas, pero es evidente que desconoce por completo los mecanismos que se esconden tras esos nombres. No sabes cómo funcionan. Es más, no quiere saberlo y disuade a los demás de hacerlo.

Eres un usuario de R. Te gusta esta herramienta porque es fácil de usar pero no por la eficacia en la resolución de tareas concretas de las que no sabes nada ni aspiras a saber.

Entienda que un desarrollador se diferencia de un usuario precisamente en su deseo de comprender el mecanismo y alcanzar la máxima eficacia de su funcionamiento.

Este objetivo sólo puede alcanzarse con un conocimiento absoluto de la materia. La facilidad para crear algo es irrelevante aquí.

De hecho, está invitando a los desarrolladores a olvidar su trabajo y convertirse en meros usuarios. Disfrutar de la facilidad de uso de las herramientas que proporciona y olvidarse por completo de investigar los principios de su trabajo.

Con este enfoque, la eficiencia puede olvidarse, y los desarrolladores no pueden olvidarla.

Si se empieza a comprender el funcionamiento de los mecanismos velados en R, se puede descubrir que no son tan perfectos como pueden parecer a un entusiasta diletante.

Con este post estoy tratando de articular un punto de vista contrario al tuyo, pero podría estar equivocado en otros. Sin embargo, así es como veo el problema.

 
mytarmailS:

Estoy de acuerdo en lo de hft, pero no entiendo por qué lo citáis siempre como ejemplo, sabéis que esas fechas no están al alcance de cualquiera, aquí nadie tiene dinero para comprar ordenadoras de occidente y canales rápidos.

¿Por qué hablar de ello y ponerlo como ejemplo?

No generalices. Puedes empezar con el OL del mercado ruso. Y HFT como sólo funciona. HFT e insider.
 
J.B:

Vamos... En ese momento estaba resolviendo un problema bastante complejo, y estaba sentado en casa, enfermo, no era conveniente preguntar a los colegas, tenía un mes para conseguir un trabajo, entonces lo resolví yo mismo, y después de un tiempo el Sr. Kombinator dijo exactamente la misma solución. Combinator nombró exactamente la misma solución. La otra cuestión es que si te enfrentaras a un problema así, probablemente no lo habrías resuelto, porque aquí necesitas saber cómo se implementa la correlación cruzada entre filas en niveles bajos y adivinar cómo usarla, R no tiene esa función "fila retrasada", y lo más importante, simplemente no habrías planteado ese problema)))) Por lo tanto, no eres un quant en un fondo de cobertura.

No soy tan tonto como crees, fíjate en la palabra correlación cruzada, lo dije en tu rama, pero es lo que hiciste, cuando aprendí por primera vez lo de la correlación cruzada tuve la misma idea que tú sobre la comparación de series(así que no estás solo ni eres único en esto) y eso fue mucho antes de tu rama, pero nunca llegué a hacerlo...

J.B:
No hay que generalizar. Puedes empezar con el OL en el mercado ruso. Y HFT como sólo funciona. HFT e insider.

puede que tengas razón.... pero creo que los OLs disponibles se escriben a mayor velocidad que plaza, y resultará que lo probado en uno y la realidad será diferente, puedo estar equivocado pero esta es la impresión que tengo

Razón de la queja: