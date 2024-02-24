Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 2742
Foro sobre trading, sistemas automatizados de trading y testeo de estrategias de trading.
Aprendizaje automático en el trading: teoría, modelos, práctica y algo-trading
MetaQuotes, 2022.08.31 15:14
Foro sobre trading, sistemas automatizados de trading y prueba de estrategias de trading
...
Maxim Dmitrievsky, 2022.09.10 12:15Hay modelo basado, agnóstico modelo y la selección de características mixtas. Si se toma agnóstica, es la correlación y la información mutua (basada en la entropía). Esta última difiere de la primera en su capacidad para capturar dependencias no lineales, por lo demás es lo mismo. En este caso es difícil hablar de relación entre característica y objetivo, incluso imposible. Es sólo una correlación. Pero es útil para deshacerse de rasgos poco informativos.
Si analizas la TS de los traders más o menos exitosos, verás que todos ellos operan niveles.
No he visto ni un solo trader de éxito que opere con la ayuda de indicadores.
Un nivel es un punto de entrada claro y comprensible con un stop.... claro.
Si puedes operar con bajo riesgo, no necesitas nada más, ¡bajo riesgo por operación/entrada precisa es lo más importante!
Con la ayuda de MO puedes buscar niveles de PD/SP esas entradas exactas, no es trivial, no es sencillo, no puedes leer sobre ello en blogs sobre MO aquí necesitas usar tu propia cabeza....
He aquí un ejemplo sobre una muestra generada aleatoriamente de 5 rasgos y 1 objetivo binario
selector forrest y fiche
La cola de tareas se ha descargado un poco - se hizo posible ejecutar el script. Lo ejecuto y obtengo un error.
¿Entiendo bien que el programa quiere una versión antigua de R 4.0?
Bueno, he buscado una versión antigua y no la he encontrado. Terrible incompatibilidad es repulsivo, por supuesto.
Yo tengo R-3.6.3.
Estoy escribiendo esto en el viejo R-3 .6. 3 por mis propias razones, así que es mi problema...
No podía imaginar que el paquete se eliminaría del tap....
correctamente
Escucha, tal vez usted no puede entrar en el comercio, con tal smikalka ??? ))
Con la compatibilidad no todo está bien, python, por ejemplo, sólo envidia tal compatibilidad....
https://stackoverflow.com/questions/62541885/package-randomforest-is-not-available-for-r-version-4-0-2
Pruébelo en la versión actual
Para resumir la teoría de Sanych (ya que él mismo no la formalizó adecuadamente ni dio ejemplos):
Con todos mis respetos, pero esto no es un resumen (ni un compendio ni un sumario). Está lleno de actitudes personales y ataques infundados.
uno pensaría que alguien tendría una teoría válida en la que "un modelo entrenado debería funcionar con datos nuevos" :-) y validada..sip.
No hay potencia suficiente para llegar al nivel EA. Pero el resultado del error de ajuste del modelo: del 8% al 22% es un error de ajuste que difiere poco en la sección de ajuste y fuera de la muestra.
además de Maxim Dimitrievski .
a eso me refiero:
para hacer clasificación, no hay que hacerlo sólo en dir arriba/abajo, sino primero al menos hacer un análisis de conglomerados para determinar cuántas clases asignar formalmente (cómo llamarlas es cuestión de gusto subjetivo)...
y sólo entonces determinar funciones discriminantes en base a las cuales asignar las muestras a tal o cual clase.... entonces la clasificación será con un porcentaje normal de precisión - cuando sabemos que las clases en las que dividimos realmente existen...
PCA es sólo una variante del análisis factorial para seleccionar características ortogonales, pero explica TODA la varianza, sin seleccionar los factores principales,
porque los componentes principales son sólo los datos brutos transformados en coeficientes de vectores propios ("loadings"), que, cuando se multiplican por los datos brutos, dan pc_scores... (algo así - lo recordaba hace tiempo - los componentes principales son sólo los datos brutos transformados en coeficientes de vectores propios ("loadings"), que, cuando se multiplican por los datos brutos, dan pc_scores... (algo así - hace tiempo que no recuerdo el algoritmo)
- pero al final PCA explica TODA la varianza, sin fs... En cambio, el análisis factorial principal utiliza "sólo la variación de la variable, común también a otras variables".... (no insisto en que este es el mejor fs -- pero hay matices en todas partes)
en general FS nadie puede hacer correctamente, y trata de culpar a la biblioteca...
PCA en combinacion con +/-3sq.cv. off -- puede ayudar a eliminar valores atípicos, pero esto es solo para distribuciones normales, ¡y aun tienes que probar que tu población gen. obedece la ley de distribución normal! - también estadísticamente... de lo contrario PCA mostrará "petróleo en Repin" (y no viceversa)...
== Veo una forma estadísticamente adecuada de construir un modelo aproximadamente como este....
===
y la librería ya es la décima cosa (aunque los moderadores llamen nombres sin entender de qué estamos hablando en DataScience normal - los perdedores siempre sueñan con un banquete y culpan a todo el mundo) -- mientras que los que realmente quieren entender, hace tiempo que se han dado cuenta de que no es el lenguaje del programador lo que importa, sino los algoritmos detrás de ciertas entidades, implementados incluso en una librería alienígena -- la esencia de las relaciones causa-efecto no cambia esto (el nombre de la librería).
p.d..
mientras los moderadores están en el banquete(, otros están trabajando - deberías tomar ejemplo de ellos - no difundas desinformación.