Aprendizado de máquina no trading: teoria, prática, negociação e não só
em statistics.mqh.
functions
PearsonCorrM - A correlação de todas as linhas com todas as linhas é a mais rápida.
Estou errado em algum lugar, mas não estou vendo isso.
Mas ele funciona com esta string
const matrix<double> matrix1 = {{2, 2, 3}, {3, 2, 3}, {1, 2, 1}};
[0,0,0]
[0.8660254037844387,0,1]]
Aparentemente, se todos os dados em uma coluna forem os mesmos, o cálculo será ignorado.
Na segunda coluna, deixei todos os dados em 2 e a segunda linha da matriz permaneceu zero. Embora provavelmente seja correto preencher a diagonal com 1s.
PS. No início, pensei que fosse um bug do Alglib.
No código antigo, os valores dos elementos eram definidos por meio de
m[row].Set(col, val);
E agora
m.Set(row,col, val);
É uma pena que não haja compatibilidade com versões anteriores. Bem, isso não importa para mim. Não estou trabalhando com o Alglib agora. Se os códigos antigos de alguém pararem de funcionar, será necessário corrigi-los.
O mais triste é que a versão antiga de
m[row].Set(col, val);
não escreve mensagens de erro, ela simplesmente não faz nada. As pessoas simplesmente não substituirão e não saberão que precisam alterar o código. Ele contará alguma coisa, mas com matrizes inalteradas.
A Pearson não calcula entre linhas, mas entre colunas?Parece que sim. Ele fornece uma única matriz.
A Alglib é uma boa biblioteca, ela tem tudo para MO. As redes neurais são muito lentas lá, era assim nas primeiras versões.
Com base nisso, calculei a matriz de correlação.
Medi o desempenho.
Resultado.
É possível ver que o Alglib calcula a matriz mais rapidamente do que o método de matriz padrão.
Entretanto, para a pesquisa de padrões, o cálculo da matriz de correlação é insano em termos de consumo de RAM.
Quanto tempo o Python leva para ler o mesmo tamanho da matriz original, como no exemplo acima?
Minha matriz nativa funcionou mais rápido no meu i7-6700
É estranho que o nativo seja mais lento, eles podem ter apenas copiado. É improvável que o Alglibe tenha algum algoritmo acelerado exclusivo sob licença.
Você já tentou as outras duas variantes do Alglib?
Se você contar em loops cada linha para cada linha ou cada linha para todas as linhas, a memória será mais econômica (2 linhas ou 1 linha + matriz). Mas isso levará mais tempo, não me lembro exatamente, mas acho que será mais lento do que a função integrada.
A situação é pior com relação à memória.
Antes de iniciar
e durante o trabalho do Matrix.CorrCoef padrão.
Aparentemente, o padrão é otimizado para uso mínimo de memória, e o Alglibov é otimizado para velocidade.
Consegui que o integrado funcionasse mais rápido: em um i7-6700.
