Aprendizado de máquina no trading: teoria, prática, negociação e não só

СанСаныч Фоменко 2023.10.04 15:29 #32811

Aleksey Vyazmikin #:

Peguei uma amostra de 2010 a 2023 (47 mil linhas), dividi-a em três partes em ordem cronológica e decidi ver o que aconteceria se trocássemos essas partes.

O tamanho das subamostras é treinamento - 60%, teste - 20% e exame - 20%.

Fiz essas combinações (-1) - essa é a ordem padrão - cronológica. Cada subamostra tem sua própria cor.

Treinei 101 modelos com Seed diferente para cada conjunto de amostras e obtive o seguinte resultado

Todas as métricas são padrão, e pode-se observar que é difícil determinar o lucro médio dos modelos (AVR Profit), bem como a porcentagem de modelos cujo lucro excede 3.000 pontos na última amostra que não participou do treinamento.

Talvez a taxa de sucesso relativa das variantes -1 e 0 no tamanho da amostra de treinamento deva ser reduzida? Em geral, parece que o Recall reage a isso.

Em sua opinião, os resultados de tais combinações devem ser comparáveis entre si em nosso caso? Ou os dados estão irremediavelmente desatualizados?

Outro "faça você mesmo"...

Há validação cruzada, tudo é mastigado e mastigado..., amplamente utilizado....

Aleksey Vyazmikin 2023.10.04 15:42 #32812

СанСаныч Фоменко #:

Outro feito por você mesmo...

Há validação cruzada, tudo é mastigado e mastigado..., amplamente utilizado.....

Esse é o problema, a validação cruzada pode não funcionar efetivamente aqui.

E qual é o objetivo desse autodesign? Maxim inverte a amostra por cronologia - presumindo que o resultado será idêntico - meu experimento mostra a falácia. Ou tudo é individual e a validação pode revelar um padrão ou uma ocorrência aleatória em toda a amostra.

Reunir uma equipe para EURUSD - Tendências, Previsões Conselheiros para quem. Muitos

[Excluído] 2023.10.04 16:09 #32813

Aleksey Vyazmikin #:

Esse é o ponto, a validação cruzada pode não funcionar de forma eficaz aqui.

E onde está essa autoconfiança? Maxim inverte a amostra cronologicamente - presumindo que o resultado será idêntico - meu experimento mostra a falácia. Ou tudo é individual e a validação pode revelar um padrão ou uma ocorrência aleatória em toda a amostra.

Não mova as setas para Maxim, especialmente quando ele não fez ou sequer pensou em qualquer uma das coisas sugeridas.

Aleksey Vyazmikin 2023.10.04 16:12 #32814

Maxim Dmitrievsky #:

Você não deve virar o jogo contra Maxim, especialmente quando ele não fez nenhuma das coisas que você sugeriu.

Como assim, ele não fez? Você já não está treinando o modelo com base no histórico mais recente?

[Excluído] 2023.10.04 16:15 #32815

fxsaber #:

Quando nenhuma matriz consegue lidar com isso.

São necessários três segundos para encontrar cadeias de caracteres semelhantes de comprimento 30K em uma cadeia de 10M.

Isso não está contando todos os padrões correlacionados possíveis, mas comparando a fonte com outros dados. Você não precisa de uma matriz, apenas de um vetor.

[Excluído] 2023.10.04 16:16 #32816

Aleksey Vyazmikin #:

O que você quer dizer com "não fiz"? Você já não está treinando o modelo com base no histórico mais recente?

Não me lembro de quem foi o primeiro a falar disso. Algum nerd. Isso não importa no meu caso.

Aleksey Vyazmikin 2023.10.04 16:17 #32817

Maxim Dmitrievsky #:

Não consigo me lembrar de quem foi o primeiro a falar sobre isso. Isso não importa no meu caso.

Como seu caso é diferente do meu?

[Excluído] 2023.10.04 16:19 #32818

Aleksey Vyazmikin #:

Qual é a diferença entre o seu caso e o meu?

porque não gosto de me comunicar com sofistas e psicólogos analfabetos)

essas pessoas não produzem conteúdo útil

Aleksey Vyazmikin 2023.10.04 16:29 #32819

Maxim Dmitrievsky #:

porque não gosto de conversar com sofistas e psicólogos analfabetos)

Essas pessoas não produzem conteúdo útil

Seu "amor" afeta os dados de alguma forma mágica?

fxsaber 2023.10.04 16:39 #32820

Maxim Dmitrievsky #:

Não se trata de contar todos os padrões correlacionados possíveis, mas de comparar a fonte com outros dados. Você não precisa de uma matriz aqui, um vetor é suficiente.

Esse é o núcleo do cálculo linha por linha da matriz.

Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 3282