Discusión sobre el artículo "Los bosques aleatorios predicen las tendencias" - página 9
Está perdiendo oportunidades comerciales:
- Aplicaciones de trading gratuitas
- 8 000+ señales para copiar
- Noticias económicas para analizar los mercados financieros
Registro
Entrada
Usted acepta la política del sitio web y las condiciones de uso
Si no tiene cuenta de usuario, regístrese
faa1947, por favor, muestre cómo funciona su modelo en el siguiente ejemplo. La primera columna es la serie modelizada, la segunda y la tercera son los predictores. ¿Cuál es el poder predictivo de estos predictores?
No soy un matemático generalista. Intento razonar de forma muy concreta, y por motivos de trading no es difícil conseguir una muestra de 10000 líneas. No sé sacar ninguna conclusión sobre 40 líneas y no veo la necesidad de aprender, aunque todo lo que hablo es aplicable a esas muestras. Para la medicina 40 líneas es normal.
1. En general, escribo sobre el sobreentrenamiento del modelo dentro del cual surgió la "capacidad predictiva".
2. Me refiero a la predicción de valores nominales "largo-corto". Se trata de modelos de clasificación. Su ejemplo, los modelos de regresión no lo hago .
Estoy dispuesto a continuar.
Necesito una cotización en la que puedo ejecutar un ZZ y tienen múltiples rupturas. A partir de ahí necesito un archivo bastante grande.
Además del propio cotir, varios predictores, incluso uno. Voy a responder a la pregunta: ¿este predictor tiene poder predictivo de longs-shorts.
Y por supuesto se necesita un archivo - ¿o sugieres escribir todo a mano?
TheXpert:
Se revela el secreto de la "alta generalizabilidad" de su muestra: el valor de la primera columna es la suma de los valores de las otras dos columnas.
Ahora lo has estropeado todo ) . ¿Y cómo es que tu alta IA no reconoció una suma trivial a la primera?Y no está diseñada para reconocer sumas, porque construye modelos para clasificación binaria, y la tarea es de la sección de regresión múltiple.
Aunque el modelo es para clasificación binaria, pero aún así, la expresión
se simplifica a: y ~ v0 + v1.
Y entonces sólo queda probar la hipótesis en una hoja de cálculo.
Buenas tardes, SanSanych.
Sobre el tema del infraentrenamiento, sobreentrenamiento, puedes consultar el borrador del libro aquí http://www.iro.umontreal.ca/~bengioy/dlbook/.
La sección 5.3.3 describe todo muy bien. En general, todo el libro es muy útil, sobre todo escrito por corifeos.
Suerte
Buenas tardes, SanSanych.
Sobre el tema del infraentrenamiento, sobreentrenamiento, puedes consultar el borrador del libro aquí http://www.iro.umontreal.ca/~bengioy/dlbook/.
La sección 5.3.3 describe todo muy bien. En general, todo el libro es muy útil, sobre todo escrito por corifeos.
Suerte
Buenas tardes.
Gracias por el enlace.
Tengo un conjunto completo de herramientas y una selección de literatura sobre el tema. Pero no facilita la aplicación práctica.
Si lo desea, puedo compartir con la esperanza de reunir todo este conjunto de herramientas a la automaticidad.
Buenas tardes.
Gracias por el enlace.
Tengo un juego completo de herramientas y una selección de literatura sobre el tema. Pero eso no facilita la aplicación práctica.
Si lo desea, puedo compartir con la esperanza de reunir todo este conjunto de herramientas para el automatismo.
Resuelvo este problema programáticamente. Los resultados son buenos.
Suerte
No soy un experto matemático universal. Intento razonar de forma muy concreta, y en base al trading no es difícil conseguir una muestra de 10000 líneas. No sé sacar ninguna conclusión sobre 40 líneas y no veo la necesidad de aprender, aunque todo lo que hablo es aplicable a este tipo de muestras. Para la medicina 40 líneas es normal.
1. En general, estoy escribiendo sobre el sobreentrenamiento del modelo dentro del cual surgió la "capacidad predictiva".
2. Me refiero a la predicción de valores nominales "largo-corto". Se trata de modelos de clasificación. Su ejemplo, los modelos de regresión no lo hago .
Estoy listo para continuar.
Necesito una cotización en la que puedo ejecutar un ZZ y tienen múltiples rupturas. A partir de ahí necesito un archivo bastante grande.
Además del propio cotir, varios predictores, incluso uno. Voy a responder a la pregunta: ¿este predictor tiene poder predictivo de largos-cortos.
Y, por supuesto, se necesita un archivo - ¿o sugieres escribir todo a mano?
Es bastante fácil comprobar si el modelo está sobreentrenado comparando su comportamiento en la muestra de entrenamiento y fuera de ella.
Esto es una gran ilusión y, según tengo entendido, todavía no está pagado por usted. El modelo dado en el artículo tiene resultados igualmente buenos en tres muestras fuera del entrenamiento - pero este modelo está sobreentrenado.
Y cómo hacer que el modelo no esté sobreentrenado depende de nuestra capacidad para determinar qué predictor-entradas son relevantes para la serie modelada y cuáles no, lo cual es mucho más difícil que determinar el sobreentrenamiento.
En primer lugar, lea atentamente el artículo: la tabla 3 muestra la importancia de los predictores en la predicción de la variable objetivo.
Y luego aprenda la matriz, por ejemplo, estudie paquetes especializados para seleccionar predictores varSerf, Boruta, FSelector. Y el paquete CORElearn tiene 35 (!) algoritmos diferentes para seleccionar los predictores que importan para la variable objetivo.
Desde mi experiencia en la selección de predictores que importan para la variable objetivo.
1. formamos un conjunto bastante grande de predictores, por ejemplo, 50 piezas con el número de barras 15000.
2. Con la ayuda de uno de los algoritmos mencionados anteriormente seleccionamos predictores en estas 15 mil barras - por lo general obtenemos de 15 a 20 piezas, que se utilizan en la construcción de modelos con más frecuencia que en el 20% de los casos.
3. A continuación, tomamos una ventana más pequeña, por ejemplo 2000 barras y empezamos a moverla una barra a la vez, seleccionando predictores significativos de los 20 de 50 previamente seleccionados.
4. La lista específica de predictores significativos cambia todo el tiempo.
Dado que aparentemente no sabe cómo determinar la relevancia de los datos, no tengo ningún interés en sus artículos y libros.
La eficacia del uso de estos paquetes en sus manos aumentará enormemente si gasta una pequeña cantidad de dinero en mi libro, que explica por qué es necesario y cómo entenderlo y ejemplos reales sobre datos reales.
Y el efecto será aún mayor si usted y yo intentamos juntos crear un modelo no entrenado sobre sus predictores. El éxito no está garantizado, pero está garantizado que no escribirás posts tan superficiales después de comunicarte conmigo. Además, serás mucho más cuidadoso con las cuentas reales.
1. formar un conjunto bastante grande de predictores, por ejemplo, 50 piezas con el número de barras 15000.
Bien, ahora está claro por qué gana dinero vendiendo su libro y no operando.
Estas son grandes ilusiones y, como me doy cuenta, aún no pagadas por usted. El modelo dado en el artículo tiene resultados igualmente buenos en tres muestras fuera de entrenamiento - pero este modelo está sobre-entrenado.
Sobreentrenamiento es un término bien establecido y bastante específico. Usted no sólo lo está sustituyendo, sino que además no está explicando qué es a su entender.
Recuerda mucho a Sulton ) en su forma de hablar.