Aprendizaje automático en el trading: teoría, práctica, operaciones y más

Vladimir Perervenko 2018.05.19 18:44 #9301

Dr. Trader:

La genética intenta encontrar los parámetros correctos para un número limitado de llamadas a funciones. Al reducir el número de variantes de este parámetro (30 en lugar de 200), el genetista puede investigar la región de 1 a 30 con más detalle. Y con razón, si se conocen los límites específicos para encontrar algún parámetro del modelo, es mejor dar esta información al genetista de inmediato.

Alternativamente:

Añade esta línea (la verde) al código, entonces el genetista tendrá 500 individuos en la población en lugar de los 50 por defecto. Y podrá probar 10 veces más modelos (pero el tiempo de ejecución del script también aumentará 10 veces), pudiendo probar tantas combinaciones de parámetros de modelos como sea posible. Incluso con un máximo de 200 neuronas creo que la genética puede encontrar un mejor resultado con 0,85 también, o al menos acercarse a él.

No puedo entender de qué genética está hablando. No hay genética en ELM. Basta con mirar la teoría del ELM o la descripción del paquete elmNN:

"El algoritmo ELM es un método de entrenamiento alternativo para SLFN ( Single Hidden Layer Feedforward Networks ) que no necesita ningún ajuste iterativo ni establecer parámetros como la tasa de aprendizaje, el impulso, etc., que son problemas actuales de los algoritmos de aprendizaje tradicionales basados en el gradiente ( como la retropropagación ).

El entrenamiento de un SLFN con ELM es un modelo de aprendizaje de tres pasos:

Dado un conjunto de entrenamiento P = {(xi , ti )|xi E R , ti E R , i = 1,..., N}, la función de salida del nodo oculto G(a, b, x), y el número de nodos ocultos L

1) Asignar aleatoriamente los parámetros de los nodos ocultos (ai , bi ), i = 1,..., L. Significa que los pesos del arco entre la capa de entrada y la capa oculta y la capa oculta se generan aleatoriamente.

2) Calcular la matriz de salida de la capa oculta H utilizando una de las funciones de activación disponibles.

3) Calcular los pesos de salida B: B = ginv(H) %*% T ( multiplicación matricial ), donde T es la salida objetivo del conjunto de entrenamiento.

ginv(H) es la inversa generalizada de Moore-Penrose de la matriz de salida de la capa oculta H. Se calcula mediante la función ginv del paquete MASS.

Una vez entrenado el SLFN, la salida de un conjunto de pruebas genérico es simplemente Y = H %*% B ( multiplicación de matrices ). Características destacadas:

- La velocidad de aprendizaje de ELM es extremadamente rápida.

- A diferencia de los algoritmos tradicionales de aprendizaje basados en el gradiente, que sólo funcionan para funciones de activación diferenciables, el ELM funciona para todas las funciones de activación continuas no constantes y acotadas.

- A diferencia de los algoritmos tradicionales de aprendizaje basados en el gradiente que se enfrentan a varios problemas como los mínimos locales, la tasa de aprendizaje inadecuada y el sobreajuste, etc., el ELM tiende a alcanzar las soluciones directamente sin estos problemas triviales.

- El algoritmo de aprendizaje ELM parece mucho más sencillo que otros algoritmos de aprendizaje populares: las redes neuronales y las máquinas de vectores de apoyo".

Incluso con un número reducido de neuronas, es imposible obtener dos redes neuronales idénticas. Está definiendo incorrectamente el umbral para transferir la salida continua a una clase. El umbral = 0,5 es el peor caso. Aceptable = mediana/ Pero hay otras más avanzadas.

Buena suerte

Redes Neurais em IA Red neuronal en forma Uso de la inteligencia

СанСаныч Фоменко 2018.05.19 18:53 #9302

Maxim Dmitrievsky:

Oh, será algo para leer, había olvidado lo que es. O más bien, olvidó la diferencia entre GBM y XGboost... o no lo sabía

gbm puede potenciar cualquier modelo, xgb parece estar en los árboles

Sé que la potenciación es ligeramente mejor que el embolsamiento, a través del cual se construye el bosque. Pero no sé si se trata de una reconversión.

El reinicio no tiene NADA que ver con el tipo de modelo.

Un modelo se reentrena en dos casos:

la presencia de predictores con ruido es un problema importante y se resuelve SÓLO con el ajuste de los predictores
Sobreajuste del modelo: "optimización" de sus parámetros, generalmente sobre una muestra pequeña. Este tipo de sobreajuste se resuelve con la experiencia de los desarrolladores.

Regresión Bayesiana - ¿Alguien ¿Es posible implementar una El editor de Meta

Maxim Dmitrievsky 2018.05.19 18:58 #9303

SanSanych Fomenko:

SanSanych, deja de ponerte histérico

Mihail Marchukajtes 2018.05.19 19:01 #9304

Vladimir Perervenko:

No puedo entender de qué genética está hablando. No hay genética en ELM. Basta con mirar la teoría de ELM o la descripción del paquete elmNN: