Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 2039

 
elibrarius:

Se puede mezclar dentro del tren o de la prueba, pero no tiene sentido, y no se puede mezclar entre el tren y la prueba. Por casualidad no los has mezclado ahí, algo muy bueno para una prueba con un examen.

No los he mezclado y el resultado no es muy bueno para la muestra de prueba: el recuerdo es pequeño.

Pero barajar está bien, si creemos que el patrón es estable, y no disminuye hacia el final de la muestra. Justo aquí el archivo podría haber sido conformado con la ayuda de un bucle y algunos de los parámetros simplemente no entraron en el área de estudio.

 
Aleksey Vyazmikin:

No he mezclado y el resultado no es muy bueno para la muestra de prueba - La recuperación es pequeña.

Pero es muy posible barajar, si creemos que el patrón es estable, y no disminuye al final de la muestra. El archivo podría haber sido formado con un bucle y algunos de los parámetros no llegaron a la zona de pruebas.

Si lo mezclas, la prueba mejorará de inmediato: obtendrás un vistazo, por barra adyacente. Es decir, una barra (10:00) llegó a la traza, la adyacente (10:01) llegó a la prueba, mientras que son muy similares tanto para la anterior como para la de destino.
 
elibrarius:
Si lo mezclas, la prueba mejorará inmediatamente - habrá un vistazo, en la barra adyacente. Es decir, un compás (10:00) está en el rastro, el adyacente (10:01) está en la prueba, y son muy similares entre sí, tanto en el pasado como en el objetivo.

¿Se turnan las barras de la muestra? Simplemente no entreno en cada barra, sólo tomo señales y en ese caso creo que es posible mezclar muestras - aumenta la cantidad de información a entrenar sin aumentar el tamaño de la muestra, que según mis datos mejora la muestra de prueba.

 
Aleksey Vyazmikin:

¿Las barras de la muestra están ahí una por una?

Ya he borrado el archivo, comprueba el tuyo. Creo que una por una es la forma más lógica de generar el archivo CSV.

 
elibrarius:

Ya he borrado el archivo, comprueba el tuyo. Creo que una por una es la forma más lógica de generar un archivo CSV.

Hay algo ahí, no sé qué es.

 2 6 0 4 2 6 57 57 100 100 -1
4 2 6 0 4 2 6 57 57 100 200 -1
4 2 6 0 4 2 6 57 57 100 300 -1
4 2 6 0 4 2 6 57 57 100 400 -1
4 2 6 0 4 2 6 57 57 100 500 -1
4 2 6 0 4 2 6 57 57 100 600 -1
4 2 6 0 4 2 6 57 57 100 700 -1
4 2 6 0 4 2 6 57 57 100 800 -1
4 2 6 0 4 2 6 57 57 100 900 -1
4 2 6 0 4 2 6 57 57 100 1000 -1
4 2 6 0 4 2 6 57 57 100 1100 -1
4 2 6 0 4 2 6 57 57 100 1200 -1
4 2 6 0 4 2 6 57 57 100 1300 -1
4 2 6 0 4 2 6 57 57 100 1400 -1
4 2 6 0 4 2 6 57 57 100 1500 -1
4 2 6 0 4 2 6 57 57 100 1600 -1
4 2 6 0 4 2 6 57 57 100 1700 -1
4 2 6 0 4 2 6 57 57 100 1800 -1
4 2 6 0 4 2 6 57 57 100 1900 -1
4 2 6 0 4 2 6 57 57 100 2000 -1
4 2 6 0 4 2 6 57 57 100 2100 -1
4 2 6 0 4 2 6 57 57 100 2200 -1
4 2 6 0 4 2 6 57 57 100 2300 -1
4 2 6 0 4 2 6 57 57 100 2400 -1
4 2 6 0 4 2 6 57 57 100 2500 -1
 
Aleksey Vyazmikin:

Hay algo ahí, no sé qué es.

A la espera de la respuesta del propietario del fichero.
 
elibrarius:
A la espera de la respuesta del anfitrión del archivo.

Por cierto, tomé el 1% de la muestra y entrené el árbol C4.5 - dio el 100% de reconocimiento en la muestra de entrenamiento y prueba, así que asumo que se trata de bucles ordenados, que necesitan ser barajados. Pero no tengo un buen algoritmo de mezcla en MQL5 - sólo puedo sacar n cadena de la muestra de prueba y de la muestra de control y crear la muestra de prueba - y si tengo suerte con el equilibrio de clases, los bucles no serán buenos aquí.

 
Aleksey Vyazmikin:

Es que yo no entreno en cada barra, sólo tomo señales y en ese caso creo que es posible mezclar muestras - aumenta la cantidad de información para entrenar sin aumentar el tamaño de la muestra, lo que según mis datos mejora la muestra del examen.

Tal vez se pueda, pero no creo que haya que tirar parte del futuro a la pista, no se puede hacer eso en el comercio real. Que el futuro siga siendo una incógnita tanto en la formación como en la realidad.
La prueba y el examen y tienen que ser cada vez mejor y peor. Esto es normal. Lo principal es estar en el lado positivo.
Utilice la validación cruzada (es posible que la tenga incorporada) o, mejor aún, haga rodar hacia delante.

 
Aleksey Vyazmikin:

Por cierto, tomé el 1% de la muestra y entrené el árbol C4.5 - me dio el 100% de reconocimiento en la muestra de entrenamiento y prueba, así que asumo que se trata de bucles ordenados, que necesitan ser barajados. Pero no tengo un buen algoritmo de mezcla en MQL5 - puede que simplemente saque n líneas de las muestras de prueba y de control y así forme una muestra de prueba - y me quedaré sin suerte de nuevo con el equilibrio de clases, y los bucles no serán buenos aquí.

Este es el tipo de glutamato que se puede mezclar bien con https://www.mql5.com/ru/blogs/post/735953
Rand 0 ... Max Int с равномерным распределением
Rand 0 ... Max Int с равномерным распределением
  • www.mql5.com
Потребовалась функция ГСЧ с гнерацией числа Int от 0 до любого значения. Получилась такая функция. Думаю распределение получилось равномерным. На форуме посоветовали другую функцию из статьи. Отбросив лишнее, получилось: Сделал сравнение по скорости обоих функций, оригинальной из статьи и просто MathRand(): Оригинальная из статьи Rnd.Rand_01...
 
elibrarius:

Tal vez se pueda, pero no creo que haya que echarle parte del futuro al aprendiz, eso no se puede hacer en el trading real. Que el futuro siga siendo una incógnita en la formación, como lo es en la realidad.
La prueba y el examen y tienen que ser cada vez mejor y peor. Esto es normal. Lo principal es estar en el lado positivo.
Utiliza la validación cruzada (puede haber una incorporada) o, mejor aún, el avance del valedor.

Si no lo haces, y no haces como Maxim, aprendiendo desde el final, acabamos aprendiendo de datos muy anticuados, lo que no es bueno. No propongo tocar la muestra del examen, pero la muestra de entrenamiento y control, creo que sí. Y luego, si hemos logrado un rendimiento estable, entonces, conociendo los ajustes del modelo básico, podemos aprender más cerca del borde para aplicar el modelo en la vida real.

No lo he resuelto con la validación cruzada - hay que automatizarlo allí, pero aún no he llegado a hacerlo.

Pero las pruebas de mordiscos - sí, este es el enfoque correcto, pero siempre falta la historia para mí, yo uso este enfoque cuando la selección de las hojas - allí ayuda mejor incluso en una muestra que ya ha sido entrenado, ya que por lo general las respuestas de las hojas son desiguales a través de la muestra, y sólo necesito los estables.

elibrarius:
Esta es una buena manera de mezclar https://www.mql5.com/ru/blogs/post/735953

Por cierto, ¿has visto un generador de este tipo que genere aleatoriamente un número a partir de una matriz sin repeticiones - eso es exactamente lo que necesito.

Razón de la queja: