Discusión sobre el artículo "Evaluación y selección de variables en modelos de aprendizaje de máquinas"

 

Artículo publicado Evaluación y selección de variables en modelos de aprendizaje de máquinas:

Este artículo se centra en aspectos específicos relacionados con la elección, los prerrequisitos y la evaluación de las variables de entrada de los modelos de aprendizaje de máquinas. Vamos a describir varios métodos de normalización, y también sus características. Revelaremos los momentos importantes del proceso que influyen de manera decisiva en el resultado final de los modelos de entrenamiento. Echaremos un vistazo exhaustivo a métodos nuevos, poco conocidos, que determinan la naturaleza informativa y la visualización de los datos de entrada.

El paquete "RandomUniformForests" nos ayudará a calcular y analizar el concepto tan importante de variable, a diferentes niveles, combinándolo en varias situaciones distintas. Estudiaremos la correspondencia de los predictores y un objetivo, así como la interacción que existe entre los predictores, y aprenderemos a seleccionar el conjunto óptimo de predictores teniendo en cuenta los aspectos más importantes.

Con el paquete "RoughSets", echaremos un vistazo al problema de elegir los predictores desde una perspectiva diferente, basándonos en otro concepto. Demostraremos que se pueden optimizar tanto los conjuntos de predictores como los ejemplos de entrenamiento.

Ejecutamos nuestros cálculos y experimentos con el lenguaje R, en concreto Revolution R Open 3.2.1 .

Error OOB

Autor: Vladimir Perervenko

 

¡Enhorabuena!

Realmente un libro de referencia sobre el tema, basado en las últimas herramientas disponibles en el campo. Todo el mundo puede replicar, todo es gratis, mantenido, desarrollado, documentado....

¡Respeto y respeto!

 
СанСаныч Фоменко:

¡Enhorabuena!

Realmente un libro de referencia sobre el tema, basado en las últimas herramientas disponibles en el campo. Todo el mundo puede replicar, todo es gratis, mantenido, desarrollado, documentado....

¡Respeto y respeto!

Saludos SanSanych.

De todas las opciones de selección de predictores probadas anteriormente, ésta es la más clara y detallada.

Suerte

 
¡Sí! ¡Sí! Me uno a San Sanych. Muchas gracias. El tema del aprendizaje profundo con todos los matices relacionados es actual y prometedor. Yo, como persona que no tiene conocimientos matemáticos demasiado profundos, necesito este tipo de información de forma sistemática y lo más accesible posible, con la posibilidad de profundizar en ciertos puntos. ¡Gracias de nuevo!
 
No quiero parecer ignorante y no quito méritos al autor, está claro que está bien hecho, pero ¿todo esto ayuda a ganar?
 
Alexey Oreshkin:
No quiero parecer ignorante y no quito méritos al autor, sin duda está bien hecho, pero ¿todo ayuda a ganar?

Eso depende.

¿Buscadores solitarios de millones con el coste de un par de semanas? No, inútil.

Las personas que comercian para ganarse la vida y darse cuenta de que un EA decente lleva varios años? Sí. Y aquí es muy importante seguir el camino correcto y no vagar por el bosque ....

PD.

¿Y con la ayuda de qué herramientas ganan dinero los participantes profesionales del mercado de valores? ¿No con la ayuda de la AT? Al fin y al cabo, toda la AT en las universidades se imparte en una quincena con créditos. Y los participantes profesionales del mercado de valores están equipados con graduados con diplomas en "Estadística", "Econometría", "Inteligencia Artificial" ...... Y para ellos el artículo comentado es bastante comprensible, aunque en muchos aspectos es nuevo.

PSPS.

No escribo para desanimar. No miremos a un Merrill Lynch con 100 000 empleados operando en todos los mercados y en todos los instrumentos.

Estamos hablando de TS muy limitadas: un par de modelos, una docena de instrumentos. Y realmente conseguir una rentabilidad superior al 20% mensual.

Este es el plan.

Ponemos R. A continuación, tomamos RAttle. Esto está disponible para cualquiera que haya escrito el Asesor Experto más simple. Una hora de trabajo. Usando Excel, preparamos un archivo fuente. Después de eso, Rattle pone a disposición 6 modelos muy decentes, tres de los cuales (ada, bosque aleatorio, SVM) son muy prometedores y por sus capacidades superan con creces cualquier variante con indicadores y, en particular, las redes neuronales (también disponible en Rattle y se puede comparar).

Y entonces comienza el trabajo tedioso, en muchos aspectos el trabajo sustancial en la excavación a través de la lista de datos de entrada. Esto es en todo el marco de Excel, y la evaluación de los resultados en Rattle. Una vez que esto se domina, usted está en y en el camino correcto.

Y en TA..... Usted escribe un Asesor Experto, parece traer beneficios..... Y entonces es seguro que se pudra y una gran felicidad si el comerciante es desconfiado y pensó en tirarlo a la basura antes de que este próximo "grial" de su depo.... filtrado Y así durante toda la vida. La experiencia no se acumula - teóricamente imposible.

 
<br/ translate="no">

Aquí está el plan.

Vamos a poner una R. A continuación, tomamos RAttle. Esto está disponible para cualquier persona que ha escrito el Asesor Experto más simple. Una hora de trabajo. Usando Excel, preparamos un archivo fuente. Después de eso, Rattle pone a disposición 6 modelos muy decentes, tres de los cuales (ada, bosque aleatorio, SVM) son muy prometedores y por sus capacidades superan con creces cualquier variante con indicadores y, en particular, las redes neuronales (también disponible en Rattle y se puede comparar).

¿Dará dinero? Entonces los traders más ricos y exitosos serían matemáticos. Buscar regularidades míticas en una serie no estacionaria es un análogo de lanzar una moneda al aire.

 

"Buscar patrones míticos en una serie no estacionaria es análogo a lanzar una moneda al aire".

Esto debería registrarse como la más arrogante de las afirmaciones más estúpidas.

Y esta pregunta: "¿Ganará dinero?" habla del nivel de formación.

En efecto: "La mente del hombre es limitada, la estupidez es ilimitada".

 
Alexey Oreshkin:

Buscar regularidades míticas en una serie no estacionaria es análogo a lanzar una moneda al aire.

Sí. Los lamers no saben que se sabe que los resultados de un lanzamiento de moneda son estacionarios. A menos, claro, que sea de plastilina, es decir, que no cambie de forma durante mucho tiempo. Sin embargo, todavía se encuentran tontos que dan la oportunidad de ganar dinero con tales procesos estacionarios.
[Eliminado]  
En general, todo el mundo debería aprender statanalysis, en cualquier caso, no será superfluo :) Pero el problema sigue siendo - lo que los datos de entrada, y para la salida, así :)
 
Maxim Dmitrievsky:
En general, todo el mundo debería aprender statanalysis, en cualquier caso, no será superfluo :) Pero el problema sigue siendo qué datos introducir, y también qué salida dar :)

Nunca será superfluo. Pero que tiene que ver input y output si incluso en este hilo, en discusiones, sugieren usar 6 modelos muy decentes. ¿Para qué son decentes? Para predecir el consumo del tráfico de calor - para este propósito pueden ser decentes. ¿Qué tiene que ver el mercado?

No estoy juzgando ni mucho menos discutiendo este enfoque para ganar dinero. Para mí es sólo un interés y discusión, nada más. Y todos los lamers que hace tiempo que crearon sus redes neuronales superinteligentes... y siguen ahí..... ni siquiera es interesante hablar con ellos.