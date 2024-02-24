Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 3285

Maxim Dmitrievsky #:
Continue quantificando 😵‍💫

Finalmente um bom conselho!

 
Aleksey Vyazmikin #:

E aqui está o resultado - as duas últimas colunas

De fato, os resultados melhoraram. Podemos supor que, quanto maior a amostra, melhor será o resultado do treinamento.

É necessário tentar treinar com 1 e 2 partes da amostra de treinamento e, se os resultados não forem muito piores do que com 2 e 3 partes, então o fator de frescor da amostra pode ser considerado menos significativo do que o volume.

Bem, o treinamento foi concluído e os resultados estão abaixo na tabela, nas duas últimas colunas.


Podemos concluir provisoriamente que, de fato, o sucesso do treinamento depende do tamanho da amostra. No entanto, observo que os resultados da amostra "-1p1-2" são comparáveis, e até melhores segundo alguns critérios, com a amostra "-1p2-3", enquanto que para a amostra "0p1-2" os resultados são duas vezes piores em termos do número de modelos que atendem ao critério determinado.

Agora, executei uma amostra com cronologia invertida, em que a amostra de treinamento consiste na amostra inicial exame+teste+trein_p3, e a amostra de teste é train_p2, e o exame é train_p1. O objetivo é verificar se é possível criar um modelo bem-sucedido com dados mais recentes que teriam funcionado há 10 anos.

Qual você acha que será o resultado?

 
Um pouco mais e o resultado mais trivial será obtido... ou talvez não seja obtido, mas sim uma descoberta que virará o mundo do ME de cabeça para baixo!

Muito bem!

 
СанСаныч Фоменко #:

Já escrevi muitas vezes sobre o "poder preditivo dos preditores", que é calculado como a distância entre dois vetores.

Encontrei uma lista de ferramentas para calcular a distância:

Isso além da ferramenta padrão, que tem seu próprio conjunto de distâncias

Boa construção
Aqui está uma tarefa sem entrada: ...
Qual você acha que será o resultado? 😀

Exatamente como antes: aqui estão os valores dos recursos sem os próprios recursos.....

E então ele escreverá: e ninguém adivinhou, o resultado é assim 😁😁😁😁🥳
 
Max, não entendo por que você está tirando sarro de mim.

Se não houver suposições, não diga nada; se houver, diga, como "o resultado será péssimo".

 
Aleksey Vyazmikin #:
...

Qual você acha que será o resultado?

Não sei, mas estou curioso para saber.

 
СанСаныч Фоменко #:

Um pouco mais e um resultado trivial será obtido... ou talvez não, mas uma descoberta que virará o mundo do ME de cabeça para baixo!

Muito bem!

Então você acha que o número de modelos será comparável nas duas primeiras colunas? Mesmo que eles sejam duas vezes mais diferentes. Seja mais específico com relação à trivialidade, por favor.

Andrey Dik #:

Max, não entendo por que está tirando sarro de mim.

Se não houver suposições, não diga nada; se houver, diga, como "o resultado será péssimo".

Escrevi acima sobre o matstat. Antes disso, escrevi sobre o kozul. Ainda antes disso, escrevi sobre os erros do Oracle (erros de marcação), quando os dados são marcados de uma forma que você não entende. O que absolutamente resulta disso é a percepção de que, em diferentes partes e durações de treinamento, os resultados variam. Depende dos dados, que não são fornecidos ou descritos.
Os erros de marcação afetam os resultados e os períodos de tempo. Qual galinha usou qual pata para marcar com qual pata será o resultado da galinha.

As pessoas aqui gostam de falar sobre os pilares básicos do aprendizado: pré-processamento, quantificação, relação dos perdedores com os alvos.... Mas não escrevem sobre qual pata é usada para a marcação, esquerda ou direita. Isso depende mais do que todos os itens acima.
 
Bem, isso já parece ser a opinião de um profissional (se está certo ou errado é outra questão).
e não há necessidade de tirar sarro.
