Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 155

 
J.B:

Se trata de una estimación empírica de la ganancia de calidad de la clasificación con - sin este factor, todo es simple, la información mutua y la determinación en sistemas multifactoriales no lineales funcionan de forma poco fiable. Y las cifras 4-5% no es un dogma, sólo tienes que entender, que el uso de "todos los mercados" y los flujos de información sin la dinámica del precio del instrumento dado se puede predecir su futuro para algunos horizonte <5% peor, eso es todo. Es decir, si se tiene una probabilidad de un minuto de predecir la futura subida frente al activo, por ejemplo el 70%, entonces excluyendo el precio de la serie predicha de los datos para el análisis se obtiene 70 - (70-50)*0,5 = 69% casi dentro de los límites de ruido de la diferencia. Bueno, por supuesto, si tienes datos en tiempo real de todos los mercados mundiales y no sólo de los mercados, pero sin información interna, y si sólo el precio de un instrumento... por desgracia, sea cual sea la IA que hayas creado, es más fácil crear un terminator que batir un mercado con esos datos.

Bueno, está bien.

Digamos que no estoy clasificando la ganancia arriba/abajo, estoy construyendo un modelo de regresión. Así que R^2 o alguna otra métrica determinista (por ejemplo, una métrica de desviación absoluta robusta) está bien.

En cuanto a la información mutua, ¿es infundada o hay pruebas sólidas de que la métrica funciona de forma poco fiable? Tengo mis dudas.

Actualización: He investigado mucho sobre datos sintéticos y reales utilizando información mutua. Si la dependencia es estacionaria, la métrica funciona bien en todas partes. Si la dependencia está al borde del ruido, la métrica puede mostrar una dependencia nula. Pero, en general, no veo ninguna razón por la que funcione peor en sistemas no lineales multivariantes que, por ejemplo, la F1. Puede leerlo aquí:https://habrahabr.ru/company/aligntechnology/blog/303750/

Pero cuando clasifiqué un movimiento de precios incremental obtuve aproximadamente la siguiente imagen (para 5 pares de divisas juntos, es decir, un modelo para todos):


Es decir, al menos los valores medianos de precisión en 50 muestras pendientes en la región del 57% como máximo. Para los pares de divisas individuales, logro una precisión media superior al 60%. Esto es sólo en datos de series temporales.

 
Alexey Burnakov:

1) No es una visión ingenua. Es la dirección de la búsqueda. Y no necesariamente una red neuronal. La tesis es la siguiente: a partir de los valores pasados de una serie temporal de precios se puede extraer información suficiente para realizar operaciones rentables (superando los costes), independientemente del horizonte temporal de la prueba a plazo real.

También publicaré un par de gráficos sobre este tema. Actualmente estoy preparando material para un artículo.

2) PS: Personalmente, teniendo en cuenta todos los factores que conducen a la sobrecarga, y tratando de tomar la condición de modelo más conservador y fiable, resulta que más de 30-40% por año (con drawdown máximo 25%) no puede exprimir. Pero ya supera el rendimiento medio de los fondos de cobertura. Todo el resto de intereses cósmicos que supuestamente se obtienen a largo plazo, puramente en el análisis técnico de las series temporales, es una mentira.

1) Por supuesto que hay que buscar en todas partes, sólo sugerí utilizar más información y sólo eso, y además un comerciante establecido no puede ser llevado por el mal camino, sólo podemos añadir información a su modelo existente.

2) la mediana de los rendimientos incluso de los fondos de cobertura americanos son tristes por debajo de los índices, los más duros apenas dan un 15-20% de media en 10 años, aunque los modelos no están autorizados a operar con sharp* por debajo de 2-3 y por supuesto la capacidad es de 10^6-9, según los cálculos todos deberían tener al menos un 20-30% pero....

 
J.B:

1) Por supuesto que hay que buscar en todas partes, sólo sugerí utilizar más información y sólo, y además un comerciante establecido no puede ser desviado de su propio camino, sólo se puede añadir información a su modelo existente.

2) la mediana de los rendimientos, incluso los fondos de cobertura americana son tristes por debajo de los índices, el más empinado apenas 15-20% dan un promedio de 10 años, aunque el modelo no se permite el comercio con un Sharpe * por debajo de 2-3 y, por supuesto, la capacidad allí 10^6-9, los cálculos deben ser al menos 20-30% pero....

1) es sí

2) bueno sí... pero este Sharp 2-3 ¿cómo se calcula? ¿Cómo calculan los fondos, o mejor dicho, CÓMO determinan que se trata de una estimación real de Sharpe en una operación real?

 
Alexey Burnakov:

PD: Personalmente, luchando con todos los factores que conducen a la sobre-aprendizaje y tratando de tomar la condición de modelo más conservador y fiable, resulta que es imposible exprimir más de 30-40% por año (con un drawdown máximo de 25%). Pero ya supera el rendimiento medio de los fondos de cobertura. Todos los demás intereses cósmicos que supuestamente se reciben a largo plazo -simplemente por el análisis técnico basado en las series temporales- son una mentira.

))) ¡Divertidísimo!

¿Cuánto apalancamiento tienen en estos 30-40% al año?

 
Dmitry:

))) ¡Divertidísimo!

¿Cuánto apalancamiento está haciendo este 30-40% al año?

Carga de depósito máxima del 10% (1:10).

Bueno, debo mencionar que a veces he visto ejemplos de hacer aún más durante años. Pero fue con la mano o con detracciones al borde de la falta.

 
Alexey Burnakov:

Carga de depósito máxima del 10% (1:10).

Bueno, debo señalar que a veces he visto ejemplos de años de hacer más que eso. Pero era a mano o con detracciones al borde de la falta.

No me refiero a la carga del depósito, sino al apalancamiento: ¿con qué apalancamiento se ganan esos 30-40% anuales?
 
mytarmailS:

Chicos hay una idea, vale la pena comprobar, lo tenía hace mucho tiempo, quería comprobar pero no podía averiguar el paquete y de alguna manera se olvidó y abandonó, pero aquí he leído la ramade J.B y recordó, resulta que también hizo algo similar:)

Hablamos de correlación cruzada: podemos calcular cuánto se retrasa una PA con respecto a la otra y si hay alguna conexión entre ellas...

La esencia de mi idea era monitorear simultáneamente un gran número de pares y construir algo así como una matriz de correlación cruzada para comparar cada par y encontrar pares que se sigan entre sí pero uno se retrase y operar con este retraso, ya que el mercado no tiene nada más constante que el tiempo, creo que los cálculos deben hacerse constantemente en cada nueva barra, para notar inmediatamente cuando aparece una nueva relación y también para notar inmediatamente cuando esta relación desaparece ...

Se puede tomar cualquier cosa, cualquier predictor, pero creo que el mejor enfoque son los pares, porque los creadores de mercado cuando el precio de su instrumento es casi siempre guiado por uno o un montón de otros instrumentos, y los indicadores clásicos es poco probable que se ajuste.

puedo intentar entrenar una red neuronal utilizando predictores que cambian dinámicamente, en fin, todo está limitado sólo por la imaginación...

Intentaría ponerlo en práctica yo mismo, pero estoy ocupado con otro proyecto y no quiero soltar las tripas

La función estándar ccf() de correlación cruzada en P

es un paquete avanzado con división pre-espectral en niveles y luego comprobación de cruce "wavemulcor" y se pueden comparar muchos BPs al mismo tiempo

Desgraciadamente, es un fracaso, las parejas caminan solas, la entropía es otra cosa, eso es más interesante.
 
Dimitri:
No me refiero a la carga de los depósitos, sino al apalancamiento: ¿con qué tipo de apalancamiento estás ganando ese 30-40% anual?
Oooh, veo que no entiendes lo que es el apalancamiento. He especificado entre paréntesis un apalancamiento de 1:10 como máximo (si resultan varias operaciones en el mercado).
 
Y por cierto sí, ya he empezado a escribir un artículo, me aseguraré de publicarlo en este hilo en cuanto esté listo. Ese será mi tratado .... :-)
 
Alexey Burnakov:
Oh, veo que no entiendes lo que es el apalancamiento. He especificado entre paréntesis un apalancamiento de 1:10 como máximo (si resultan varias operaciones en el mercado).

El 10% es la carga del depósito.

Si tienes un depósito de 1.000 dólares, lo cargas en un 10%: abres una operación por 100 dólares.

Ahora, ATENCIÓN, dependiendo del apalancamiento proporcionado por su corredor/entrenador usted puede comprar diferentes lotes - $10,000 (1:100), $5,000 (1:50), $20,000 (1:200).

P.D. fuckerbaby........

Razón de la queja: