k-means, el más sencillo
Ves, incluso puedo ver lo que estás agrupando)) Estoy loco por mí mismo).
En algún lugar mostré (olvidé dónde, porque no he estado operando durante más de un mes) que la distribución de probabilidad de los incrementos del mercado es el producto de las distribuciones gaussiana y exponencial de CB (o en general - Erlangian).
La distribución Erlang es responsable de los intervalos de tiempo entre las cotizaciones de los ticks y el generador de dichos números tiene el siguiente aspecto
Aquí Lambda es la intensidad del flujo de eventos (comillas).
Si Lambda=const, el proceso es estacionario, pero la intensidad del flujo de mercado es diferente en diferentes puntos del tiempo, es decir, Lambda=f(t) que determina el proceso no estacionario en general.
Por lo tanto, para distinguir un proceso estacionario, es necesario considerar secciones separadas de BP con la misma densidad de flujo como un todo.
Por lo tanto, los intentos de dividir la PA en horas dentro de un día, y luego "pegar" estas horas - claramente tienen derecho a la vida.
P.D.
Según mis cálculos, la misma densidad de flujo se observa en las horas siguientes dentro de un día:
0
1, 23
2, 5, 22
3, 4, 8, 21
6, 7
9, 12, 19
10, 11, 15, 18
13, 14
16
17
20
Bueno, esto es sólo para información...
¿Por qué te asustas? Lo escribí al principio
¿Dónde? No lo he visto.
¿se pueden extraer las matrices con los centroides para utilizarlas por separado en otro programa con nuevos datos?
¿Tal vez R tenga eso? Compruébalo.
si lo he entendido bien, sí, puedo
enseñar
volver a escribir específicamente lo que quiere hacer sin codificar innecesariamente
tres centroides de tres clusters
después del modelo de ajuste debe haber una matriz o algo así, dependiendo del algoritmo
que puede utilizarse para calcular las predicciones sobre los nuevos datos... y sobre los datos antiguos...
para transferirlo al metaque y leerlo en el probador