Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 1911

 
Maxim Dmitrievsky:
Lo estás inventando sobre la marcha). 24 columnas, no 100. Tú mismo pediste el archivo. No hay errores (lo he explicado). 300 y un montón de líneas porque te di un año, por lo que su "generador" no caca a contar)) Pero continúa. No tuve tiempo de terminar de verlo, pero el principio es prometedor. Dejaré una reseña completa más tarde. Parece que tendré que responder en formato de vídeo.
Sí Maxim lo siento, no era su archivo de formación, pero el significado del mensaje creo que está claro. Bueno, 24 columnas no pueden explicar 2000 vectores sin repetición. No es físicamente posible ....
 
Mihail Marchukajtes:

Tengo un archivo sucio de 7700 columnas donde tomo 24 ligas, así que no sigas, sino que mira aquí. Aquí está su archivo.

Y aquí está la mía.

Cuál es la diferencia???? No te mantendré en suspenso. En el análisis de componentes principales, cuando cada columna es su propio sistema de coordenadas, es importante que puedan agruparse para que los puntos de diferentes columnas puedan representarse en el mismo sistema de coordenadas. La interpretación es sencilla. Cuantos más vectores verticales y horizontales, más frío es. Lo que tienes es una mancha uniforme y contundente.

Lo he ordenado un poco, esencialmente los ángulos entre los vectores muestran correlación (90g = 0 correlación). Alimento los rezagos incrementales, ahí no habrá correlación, es como ruido blanco.

Que te conformes con 50 ejemplos de entrenamiento (50 líneas) es sorprendente, es lo poco profunda que tiene que ser la cuadrícula. Se necesitan muchos ejemplos para eliminar funciones innecesarias (idealmente hasta una) que puedan describir datos.

 
Mihail Marchukajtes:
Sí Maxim lo siento, ese no era tu archivo de formación, pero creo que el mensaje es claro. Bueno, 24 columnas no pueden explicar 2000 vectores sin repeticiones. Es físicamente imposible ....


La próxima vez haré un baile.

 
Maxim Dmitrievsky:

La próxima vez bailaré.

vtreet no utiliza rsa, no se trata de eso en absoluto. Yo mismo no entiendo lo que hacen ,

preprocesan los caracteres que faltan y demás + crean nuevas características pero no lo posicionan como una inducción de características así como cuentan como una característica pero no lo posicionan como una selección de características, así que no sé qué es ni cómo funciona.



Con respecto a "PCA es lineal y lo que has ptsashil allí se puede tirar a la basura.

Apuesto a que puedo obtener un precio a partir de una descomposición PCA en datos nuevos con una precisión de +-98%.

Puedo probarlo, así que aquí te equivocas, quizás hasta te mola que sea lineal, si no, no lo habría recogido.

 
Maxim Dmitrievsky:


la próxima vez bailaré

En general, estoy de acuerdo con la terminología en la que las columnas son entradas (variables explicativas), las filas son vectores de entrenamiento o ejemplos. Es posible que para algunos algoritmos de aprendizaje esto sea crítico cuando hay menos filas que columnas, pero cuando hay más filas que columnas te acercas a ejemplos idénticos que llevan al modelo a la zona de sobreaprendizaje. No es posible describir 350 ejemplos (filas) con 24 variables explicativas (columnas) y evitar las repeticiones.

No uso el PCA en general de ninguna manera, era sólo un ejemplo para otro usuario. Se puede utilizar para evaluar el conjunto resultante hasta donde sea posible dividirlo.


P.D. La vaina... joder con la canción está acreditada. ¡Bien hecho!

 
Así que, teóricamente, la matriz más genial para aprender es una matriz cuadrada cuando el número de columnas y filas es el mismo.... HMM... Por cierto, esto me dio una idea para tomar tantos ejemplos para el entrenamiento donde el mismo número de columnas se dejan después de pre-procesamiento.... Es una idea... así es.... La matriz cuadrada no tiene 100% de repeticiones....
 
Mihail Marchukajtes:

En general, estoy de acuerdo con la terminología en la que las columnas son entradas (variables explicativas), las filas son vectores de entrenamiento o ejemplos. Es posible que para algunos algoritmos de aprendizaje esto sea crítico cuando hay menos filas que columnas, pero cuando hay más filas que columnas se obtienen ejemplos casi idénticos que llevan al modelo a la zona de sobreaprendizaje. No es posible describir 350 ejemplos (filas) con 24 variables explicativas (columnas) y evitar las repeticiones.

No uso el PCA en general de ninguna manera, era sólo un ejemplo para otro usuario. Se puede utilizar para evaluar el conjunto resultante hasta donde sea posible dividirlo.


P.D. La vaina... joder con la canción está acreditada. ¡Bien hecho!

Sólo si el número de etiquetas de las clases es muy diferente (las clases no están equilibradas)

Te estaba torturando para nada. el más famoso mago y hechicero ))))

 
Mihail Marchukajtes:

Te acercas a ejemplos idénticos, lo que lleva al modelo a la zona de sobreaprendizaje.

estos "ejemplos similares" crean estructuras estadísticamente significativas - ¿qué es la estadística? es cuando algo se repite y se pueden sacar conclusiones de ello

Mihail Marchukajtes:

No es posible describir 350 ejemplos (filas) con 24 variables explicativas (columnas) y evitar las repeticiones.

Qué tiene de malo la repetición ????

 
mytarmailS:

estos "mismos ejemplos" son exactamente los que crean estructuras estadísticamente significativas - ¿qué es la estadística? es cuando algo se repite y se pueden sacar conclusiones de ello

cuál es su problema con la repetición????

Hay tres tipos de mentiras: las mentiras, las mentiras flagrantes y las estadísticas. - Mark Twain.

La repetición conduce al aprendizaje de memoria, necesitamos generalizar la red. Es decir, necesitamos alimentar un único vector para que cuando aparezca un nuevo vector, la red reaccione como se espera. Si un conjunto contiene un grupo de vectores cercanos, la red no los memorizará....

En otras palabras, el algoritmo asignará un factor de ponderación excesivamente alto a estos dos vectores próximos....

 
Maxim Dmitrievsky:

sólo si las etiquetas de las clases tienen un número muy diferente (las clases no están equilibradas)

El más famoso mago y hechicero ))))

En principio hablo de dos clases y no más. Si hay tres o más clases, se permite crear una tabla de vectores únicos donde las filas son más que las columnas, pero su unicidad será definida por el objetivo exclusivamente.
Razón de la queja: