Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 3282

 
Aleksey Vyazmikin #:

Peguei uma amostra de 2010 a 2023 (47 mil linhas), dividi-a em três partes em ordem cronológica e decidi ver o que aconteceria se trocássemos essas partes.

O tamanho das subamostras é treinamento - 60%, teste - 20% e exame - 20%.

Fiz essas combinações (-1) - essa é a ordem padrão - cronológica. Cada subamostra tem sua própria cor.


Treinei 101 modelos com Seed diferente para cada conjunto de amostras e obtive o seguinte resultado


Todas as métricas são padrão, e pode-se observar que é difícil determinar o lucro médio dos modelos (AVR Profit), bem como a porcentagem de modelos cujo lucro excede 3.000 pontos na última amostra que não participou do treinamento.

Talvez a taxa de sucesso relativa das variantes -1 e 0 no tamanho da amostra de treinamento deva ser reduzida? Em geral, parece que o Recall reage a isso.

Em sua opinião, os resultados de tais combinações devem ser comparáveis entre si em nosso caso? Ou os dados estão irremediavelmente desatualizados?

Outro "faça você mesmo"...

Há validação cruzada, tudo é mastigado e mastigado..., amplamente utilizado....

 
СанСаныч Фоменко #:

Outro feito por você mesmo...

Há validação cruzada, tudo é mastigado e mastigado..., amplamente utilizado.....

Esse é o problema, a validação cruzada pode não funcionar efetivamente aqui.

E qual é o objetivo desse autodesign? Maxim inverte a amostra por cronologia - presumindo que o resultado será idêntico - meu experimento mostra a falácia. Ou tudo é individual e a validação pode revelar um padrão ou uma ocorrência aleatória em toda a amostra.

 
Aleksey Vyazmikin #:

Esse é o ponto, a validação cruzada pode não funcionar de forma eficaz aqui.

E onde está essa autoconfiança? Maxim inverte a amostra cronologicamente - presumindo que o resultado será idêntico - meu experimento mostra a falácia. Ou tudo é individual e a validação pode revelar um padrão ou uma ocorrência aleatória em toda a amostra.

Não mova as setas para Maxim, especialmente quando ele não fez ou sequer pensou em qualquer uma das coisas sugeridas.

 
Maxim Dmitrievsky #:

Você não deve virar o jogo contra Maxim, especialmente quando ele não fez nenhuma das coisas que você sugeriu.

Como assim, ele não fez? Você já não está treinando o modelo com base no histórico mais recente?

 
fxsaber #:

Quando nenhuma matriz consegue lidar com isso.

São necessários três segundos para encontrar cadeias de caracteres semelhantes de comprimento 30K em uma cadeia de 10M.

Isso não está contando todos os padrões correlacionados possíveis, mas comparando a fonte com outros dados. Você não precisa de uma matriz, apenas de um vetor.

 
Aleksey Vyazmikin #:

O que você quer dizer com "não fiz"? Você já não está treinando o modelo com base no histórico mais recente?

Não me lembro de quem foi o primeiro a falar disso. Algum nerd. Isso não importa no meu caso.

 
Maxim Dmitrievsky #:

Não consigo me lembrar de quem foi o primeiro a falar sobre isso. Isso não importa no meu caso.

Como seu caso é diferente do meu?

 
Aleksey Vyazmikin #:

Qual é a diferença entre o seu caso e o meu?

porque não gosto de me comunicar com sofistas e psicólogos analfabetos)

essas pessoas não produzem conteúdo útil

 
Maxim Dmitrievsky #:

porque não gosto de conversar com sofistas e psicólogos analfabetos)

Essas pessoas não produzem conteúdo útil

Seu "amor" afeta os dados de alguma forma mágica?

 
Maxim Dmitrievsky #:

Não se trata de contar todos os padrões correlacionados possíveis, mas de comparar a fonte com outros dados. Você não precisa de uma matriz aqui, um vetor é suficiente.

Esse é o núcleo do cálculo linha por linha da matriz.