He utilizado el método "repeatedcv" en trainControl, con una división por defecto. Hace poco escribí el código para la validación cruzada yo mismo, probé la validación cruzada tanto con barras tomadas al azar como con trozos tomados consecutivamente sin huecos. No vi ninguna diferencia en la prueba frontal, dio casi el mismo resultado en ambos casos. Dividí los datos para el entrenamiento/validación cruzada 50%/50%, tal vez en esa proporción ya no importa.
Voy a experimentar con eso en caret...
Recuerdo que en ese artículo que colgaste hace un tiempo, la comparación líder era árboles potenciados con el método de Platt (algo así). Todo lo que he encontrado en google sobre este método es que hay que pasar la salida del modelo a sigmoide y tomar su resultado. ¿Pueden gbm o xgboost hacer eso? Este enfoque parece ser mejor que el bosque, la neurona y algunos "árboles embolsados" que ocupan el segundo lugar.
Sobre el CV. El valor por defecto es la partición aleatoria... Para las series temporales, la separabilidad temporal es importante... puedes hacerlo en caret. Los pliegues personalizados de las series temporales de Caret CV... Búscalo. En mi código que he publicado antes. Está implementado en traincontrol.
Te estoy mirando y estoy asombrado... Quieres sacar algo de la nada. No puedo mirar más, así que te echaré una mano. En realidad, la topología de la red es secundaria. En el aprendizaje automático, en forex y más allá, los datos son lo primero. Es decir, lo más importante en el diseño de redes neuronales no es la topología de la red ni el método de entrenamiento. Son datos de entrada y datos de salida. Si los datos son relevantes para el mercado - cualquier incluso un pequeño perseptrón resolverá su problema de clasificación y funcionará bien en el futuro, por una simple razón, porque los datos de entrada son relevantes para el mercado y estos datos son capaces de predecirlo. Y lo que se pretende es arañar la superficie de la información irrelevante. Lo siento, pero el resultado también será irrelevante.... En cuanto al mercado, en forex, lo principal es el volumen, y luego la reacción del mercado. Y no el volumen que está en MT (tick), sino el volumen real de los futuros, el mismo euro. Utiliza el delta del clúster para ayudarte. Hay mucha información útil. Por lo tanto, utilizando el volumen de las operaciones, aumentará significativamente el rendimiento de cualquier red, incluso el más simple perseptron. También tiene un delta, que también es extremadamente útil. Pero usted está tratando de construir un modelo sobre la base de indicadores que son secundarios, yo diría terciarios después del precio y espera un milagro de él. No habrá ningún milagro, se lo aseguro.....
En el aprendizaje automático, en forex y más allá, los datos son lo primero. Es decir, lo más importante a la hora de diseñar redes neuronales no es la topología de la red ni el método de entrenamiento. Son datos de entrada y datos de salida. Si los datos son relevantes para el mercado, cualquier incluso un pequeño perseptrón resolverá su problema de clasificación y funcionará bien en el futuro, por una simple razón, porque los datos de entrada son relevantes para el mercado y estos datos son capaces de predecirlo.
Ni siquiera tengo nada que discutir, eso es correcto. Eso también lo sabemos, y estamos discutiendo no sólo los modelos de clasificación, sino también los métodos de selección de predictores (datos de entrada), lee primero este hilo.
Supongo que espera seleccionar manualmente una docena de entradas, construir un modelo, operar durante una semana, empezar a perder, empezar a elegir entradas de nuevo. Yo también lo he hecho, a veces tengo estrategias divertidas como "toma un cierto grano para inicializar la neurona, entrénala exactamente 7777 iteraciones, todo estará bien, pero cada dos martes tienes que operar contra su señal". Optimizar la red con nuevos datos cada dos días". Este tipo de estrategias son reales, pero se necesita mucho tiempo para elegir algo así y sólo da beneficios durante un par de semanas. Todo porque dicha estrategia se basa en algún patrón a corto plazo.
En su lugar, selecciono un algoritmo para la selección automática de entradas. Es sencillo, hay unas 100 entradas en cada barra y un algoritmo que selecciona tal combinación de entradas que todas juntas dan consistentemente una señal de compra/venta válida durante todo el año. No es como la optimización de Asesores Expertos en mt5, donde un EA puede conseguir grandes resultados y fallar en el fronttest, sino que es más complicado, con validaciones cruzadas y diferentes criterios de estimación del resultado. Antes seleccionaba un centenar de entradas, ahora es más pequeño, sólo un par de docenas. Obtengo un 60%-70% de precisión en el fronttest, pero sigue siendo inestable, necesito deshacerme de los grados de libertad en todo el proceso de selección y entrenamiento para obtener aproximadamente los mismos resultados incluso partiendo de cero cada vez.
Las empresas con instalaciones y programadores propios utilizan el mismo software de análisis y modelización de datos del que disponemos nosotros. Digamos que entrenan el modelo perfecto y obtienen un 100% de beneficio al mes. Tengo menos poder, con los mismos datos podré construir un modelo más débil con, digamos, sólo un 50% de beneficio. Esto será suficiente para mí.
Demagogo, ouch. Ya es hora de que salgas de aquí. Construir una casa.
"El perro ladra, la caravana se va". С
Permítanme decirlo de esta manera. Los mejores fondos presentan una rentabilidad media anual del 40-50%. Pueden trabajar allí tanto personas inteligentes como excelentes. No veo nada raro que me acerque al 50% al año y tenga este crecimiento.
En primer lugar - los fondos muestran un rendimiento tan miserable por una sola razón, la falta de liquidez en el mercado, es difícil poner una gran cantidad de dinero en la estrategia, que sin duda no tiene tales problemas
En segundo lugar, ¿por qué no aspirar al 100% mensual, por ejemplo?
Estoy totalmente de acuerdo conMihail Marchukajtes, para elevar la calidad del reconocimiento hay que elevar la calidad de los signos, y los modelos.... su influencia +/- 5% en el resultado global
Usted también es un demagogo. Bien, muéstranos las entradas con este grado de información. ¿Por qué nos quedamos con los mejores modelos? Para exprimir las señales de los datos ruidosos, si tuviéramos datos sin ruido, también podríamos hacer una fórmula en Excel.
"100% al mes". Esforzarse, mostrar resultados, compartir ideas. Le escucharemos, cómo aumentar su rentabilidad en 20 veces y cómo no retirarse en el próximo mes de la detracción.
"long-livers" de forex. Más de 5 años de comercio. Clasificado por FS. Sí, algunos tienen rendimientos cósmicos, pero otras estadísticas son malas. Esta es la realidad. Y Stabiliti está cambiando de manos. Todos los demás muestran FS de 3 y menos.
El hombre recomienda la lectura de "MSUA" y el análisis espectral en particular Fourier
Más allá de lo que los resultados que "demagogo" han logrado, pero en realidad muy modesto, buenas ideas como pienso mucho, mi investigación va en muchas direcciones simultáneamente y hay una gran falta de conocimiento en diversos campos, porque a menudo pedir ayuda a los participantes del foro, pero sobre todo para ayudar y nadie quiere, dicen que se aprende a sí mismo, y luego..... sólo si yo mismo he dominado todo, entonces ¿por qué hago esta comunicación, como sin lógica, me distraigo.
Aquí está lo mejor de la dan. mamá. que me las arreglé para exprimir de RF en los nuevos datos es el 50% por mes durante 2 meses en una fila, pero todo sigue siendo muy inestable, traté de llenar las fotos 10 veces, pero no lo entiendo (lo consiguió)
La conclusión es que no hay que limitarse con plantillas como el 30% anual es genial, no es genial, es un marco para la mente y la creatividad