Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 2746

 
СанСаныч Фоменко #:

Una vez más.

pero el objetivo no es un zigzag, ¿verdad?

 
СанСаныч Фоменко #:

Completamente equivocado

1. Arriba escribió sobre su comprensión de la "capacidad de predicción"

2. El significado no está claro

3. no trayne en el sentido habitual. Ajuste de bosque aleatorio. Tamaño de la muestra = 1500 barras, número de árboles = 150. El tamaño de la muestra se obtiene del gráfico de error de ajuste. Sobre esta muestra de 170 predictores, se realiza la selección y el preprocesamiento de los predictores según distintos criterios. Finalmente, de los 20-30 predictores restantes, se seleccionan entre 5 y 10 predictores en función de su máxima capacidad predictiva y se ajusta el modelo. La siguiente barra se predice utilizando el modelo obtenido. Con la llegada de una nueva barra, se repite todo el proceso de construcción del modelo.

El error máximo de ajuste se sitúa en torno al 20%, pero es bastante raro. Suele rondar el 10%.

4. Antes he descrito mi enfoque.

Está más claro. ¿De dónde proceden los objetivos, según los resultados de la agrupación?
 

La confianza en que los resultados futuros serán igual de decentes procede del estadístico de capacidad predictiva, que

1. debe tener un valor sd suficientemente alto

2. un valor sd bajo.

Como de costumbre, si uno puede encontrar predictores que tengan un sd inferior al 10%, entonces la variación en el error de predicción será más o menos la misma.


Mi conclusión:

1. Deberíamos adoptar (o desarrollar) uno de los algoritmos de "capacidad de predicción"

2. Encontrar una lista de predictores cuyos valores de capacidad predictiva difieran en un factor de uno

3. Ejecute una ventana y obtenga los estadísticos: media y desviación de la media. Si tiene suerte, encontrará esa lista. La encontré.

El modelo no importa. En mi predictores RF, ada, GBM, GLM dar casi el mismo resultado. SVM es ligeramente peor. No es bueno en absoluto con nnet.


Todo el éxito está en los predictores y su preprocesamiento. ¡Y usted está haciendo tonterías aquí!

 
Maxim Dmitrievsky #:
Eso tiene más sentido. ¿De dónde vienen los objetivos, de los resultados de la agrupación?

Tengo el signo de los incrementos normales.

El objetivo es secundario. El problema con el objetivo son los predictores: puedes hacer coincidir predictores con un objetivo concreto o no.

 
СанСаныч Фоменко #:

Tengo una señal para los incrementos normales.

El objetivo es secundario. El problema del objetivo son los predictores: se pueden ajustar predictores a un objetivo concreto o no.

Yo los ajusto a uno o varios signos en la fase de marcar objetivos, mediante correlación o al menos se puede hacer Mahalanobis. Es decir, se puede hacer cualquier conjunto informativo

El tema de la ventana deslizante ya está claro, sólo hay que volver a entrenar el modelo y volver a seleccionar los signos

Yo me limitaría a calcular estadísticas sobre ellas en una ventana deslizante y elegir las óptimas, para no volver a entrenar en cada barra.
 
СанСаныч Фоменко elección de los predictores que producen los modelos.

La capacidad predictiva es correlación de información y NO:

1. La correlación es la "similitud" de una serie estacionaria con otra, y siempre hay algún valor, y no hay ningún valor de "no relación". La correlación siempre tiene algún valor, por lo que se puede utilizar fácilmente la correlación para encontrar la relación entre un profesor y los posos del café.

2. La selección de fichas es la frecuencia con la que se utilizan fichas al construir modelos. Si tomamos predictores que no tienen nada que ver con el profesor, seguimos obteniendo una clasificación de fiches.

Un análogo a mi entender del "poder predictivo es, por ejemplo, caret::classDist(), que define las distancias de muestreo Mahalanobis para cada clase de centros de gravedad. O woeBinning. Hay muchos enfoques y muchos paquetes en R. Hay más basados en la teoría de la información.

Todavía no lo entiendo. No es correlación o frecuencia de uso. ¿Cómo se estima el presc.sp. en el entrenamiento o por qué se estima?
¿O es algún tipo de indicador de equilibrio que se llama así?
S.F. He seguido leyendo y me ha quedado más claro.
 
СанСаныч Фоменко #:

Tengo una señal para los incrementos normales.

El objetivo es secundario. El problema del objetivo son los predictores: puedes hacer coincidir predictores con un objetivo concreto o no.

El signo de los incrementos y el signo de ZZ no garantizan el beneficio. 5 incrementos pequeños se solaparán fácilmente con uno fuerte, pero en sentido contrario. Y 10, por ejemplo, barras rentables nocturnas también serán cubiertas por 1 barra perdedora diaria (sólo un 10% de error).

¿Qué línea de equilibrio se obtendrá en los nuevos datos? Espero que no sea horizontal con pequeñas fluctuaciones hacia arriba / abajo?

En los artículos de Vladimir el error también está en torno al 10-20%, pero la línea de equilibrio no inspira optimismo.

 
Valeriy Yastremskiy #:
Sigo sin entenderlo. No es correlación ni frecuencia de uso. ¿Cómo se estima el presc.sp. en el entrenamiento, o estimado por qué?
¿O es algún tipo de indicador de equilibrio que se llama así?

El mismo álgebra vectorial, el mismo mapeo de características que elimina el problema de multicolinealidad.

La distancia de Mahalanobis es una de las medidas más comunes en estadística multivariante.

- es decir, la selección/proyección espacial de "componentes" esencialmente iguales .... ubicación en el espacio de las características multicolineales da un campo para la aplicación del álgebra vectorial(!), para no deshacerse de la multicolinealidad de forma artesanal, es mejor simplemente tenerla en cuenta (por ejemplo, reduciéndola al espacio 3d o lo que se quiera y operar con proyecciones, y si es necesario, los datos iniciales se pueden multiplicar por estas estimaciones, como algo parecido a las cargas factoriales, aunque normalmente la propia librería mide esta distancia Mah alanobis y da los resultados).

De todas formas, el resultado final es la misma aproximación a la media y st.dev y tomar decisiones de trading basadas en ellas.

- no hay otra modelización en la naturaleza -- sólo hay formas de resolver problemas comunes (heteroscedasticidad, multicolinealidad, autocorrelación de residuos) en un espacio (diferente-) n-dimensional...

y no hay forma de escapar de la estadística ... la solución al problema de la correlación de rasgos está aquí en forma explícita ...

p.s..

ACTUALIZADO: todavía esta herramienta(MD) se utiliza para clustering/agrupamiento/clasificación_multidimensional... para seleccionar valores atípicos en un espacio multidimensional ... a veces se utiliza junto con la distancia euclidiana... "cuando las variables no están correlacionadas -- la distancia Mahalanobis coincide con la distancia euclidiana habitual".... en LDA... en general tz es la que he descrito antes....

con este post de ninguna manera quise equiparar PCA y clustering, solo estaba en mi memoria que tanto PCA como MD dan la posibilidad de deshacerse de outliers en el espacio multidimensional... pero la esencia de mi actualización no cambia: todas estas son soluciones de problemas espaciales mediante álgebra vectorial para tener en cuenta el problema de la multicolinealidad (para que no distorsione/desplace las estimaciones estadísticas).

Машинное обучение в трейдинге: теория, модели, практика и алготорговля - Попробуйте сделать кластерный анализ, чтобы определиться сколько классов формально выделить как их назвать уже дело субъективного вкуса.
Машинное обучение в трейдинге: теория, модели, практика и алготорговля - Попробуйте сделать кластерный анализ, чтобы определиться сколько классов формально выделить как их назвать уже дело субъективного вкуса.
  • 2022.09.15
  • www.mql5.com
поскольку он сам не смог нормально формализовать и привести примеры его способ отбора признаков основан на корреляции. чтобы определиться сколько классов формально выделить как их назвать уже дело субъективного вкуса. на основании которых относить sample ы к тому или иному классу
 
Maxim Dmitrievsky #:
para que no tengas que cambiarte en cada bar.

Es una cuestión de principios, es una cuestión de principios cambiar de zapatos. No necesitamos un modelo que viva 100 años. Necesitamos un modelo que pueda predecir la siguiente barra con un error bajo. Luego viene el Asesor Experto, y tiene sus propios problemas con esta predicción.

 

Más arriba se ha deslizado que el valor incluso de una predicción correcta puede ser cero.

Para mí, el valor de una predicción depende no sólo de la probabilidad de error, sino del propio profesor.

¿El profesor está prediciendo la siguiente barra o la tendencia?

¿En qué periodo de tiempo está haciendo la predicción y en qué periodo de tiempo estamos operando?

¿Qué beneficio objetivo está prediciendo nuestro profesor?

¿Cuál es la relación entre el profesor y el spread?

Hay muchas preguntas que no se han tratado aquí.