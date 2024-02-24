Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 3287
Eu uso o Valking Forward pelos mesmos motivos.
E sim - forte dependência do tamanho da seção do trem. Por exemplo, em 20000 linhas é encontrado algo no avanço, mas em 5000 ou 100000 - aleatório.
Se "algo" for encontrado, qual é sua vida útil fora do treinamento normalmente?
Eu nem sei o que os quadrados significam. Provavelmente o que o cara da maçã escreve :)
Para mim, uma vez por semana é aceitável em termos de velocidade - 5 anos para 260 retreinamentos passam aproximadamente.
Podemos concluir provisoriamente que, de fato, o sucesso do treinamento depende do tamanho da amostra. No entanto, observo que os resultados da amostra "-1p1-2" são comparáveis, e até melhores segundo alguns critérios, com a amostra "-1p2-3", enquanto que para a amostra "0p1-2" os resultados são duas vezes piores em termos do número de modelos que atendem ao critério determinado.
Agora, executei uma amostra com cronologia invertida, em que a amostra de treinamento consiste na amostra inicial exame+teste+trein_p3, e a amostra de teste é train_p2, e o exame é train_p1. O objetivo é verificar se é possível criar um modelo bem-sucedido com dados mais recentes que teriam funcionado há 10 anos.
Qual você acha que será o resultado?
Não precisei esperar muito - o resultado está na última coluna da tabela
Tentarei comentar de forma não tendenciosa. Por um lado, podemos dizer que a alteração da cronologia da amostra piorou significativamente os resultados pelo critério principal - o número de modelos adequados, mas, por outro lado, o próprio fato de que esses modelos foram encontrados diz que há alguns padrões estáveis nos dados. Ou é aleatório? Sim, é claro, precisamos coletar outras amostras e realizar estudos semelhantes, e só então poderemos tirar conclusões com mais confiança. Por enquanto, essas são apenas informações para reflexão.
Objetivamente, há muitos dados - geralmente uso múltiplos de amostras menores para treinamento, embora comparáveis ao curso cronológico. Quanto mais triste a taxa de recuperação parece em todos os experimentos. Fico até surpreso que ninguém tenha prestado atenção a isso. Em geral, podemos dizer repetidamente que as métricas padrão dão uma indicação ruim do resultado financeiro se não forem usados takeouts e stops fixos.
Se você tiver alguma ideia/desejo de combinar aqui (gráficos de amostra) com alguma coisa, diga-me - tentarei verificar o que acontecerá.
Eu apenas retreino o modelo uma vez por semana. Ele pode viver mais tempo, não pesquisei isso.... mas talvez menos, e é necessário retreinar como SanSanych em cada barra (se H1, então, em princípio, é possível).
Qual é o resultado desse retreinamento em conjunto?
Max, não entendo por que está tirando sarro de mim.
Se não houver suposições, não diga nada; se houver, diga, como "o resultado será péssimo".
Se for engraçado, você pode rir, e se for triste, você pode chorar.
O que Aleksey Vyazmikin está discutindo aqui não pode causar sugestões e é impossível avaliar "merda - não merda".
Por exemplo, um homem chega e diz:
- vamos mandar um ferro para a lua.
Nós olhamos com surpresa.
E o homem diz:
- e vamos mudar a temperatura do ferro e colocar diferentes quantidades de água nele.
Você reagirá "se não houver suposições - fique em silêncio, se houver - fale, como "o resultado será uma merda"?
O que o leksey Vyazmikin faz não tem nada a ver com os problemas do MoD. Ele se baseia em uma ópera e tenta obter uma resposta de outra ópera - tudo conversa fiada de um homem com uma bagunça na cabeça.
Todos os gráficos que mostrei no ano passado foram obtidos dessa forma. Somente OOS por Valking Forward.
A julgar pelas imagens, o Recall também é baixo, ou seja, o modelo tem pouca confiança em qualquer coisa e é muito cauteloso nas previsões.
Eu apenas retreino o modelo uma vez por semana. Ele pode viver mais tempo, não pesquisei isso.... mas talvez menos , e é necessário retreinar como SanSanych em cada barra (se H1, então, em princípio, é possível).
Descobri um problema fundamental aqui: olhar para frente. Ele se manifesta da seguinte maneira: pegamos partes de um arquivo grande, as ensinamos, depois as testamos e verificamos - tudo está normal, o erro é praticamente o mesmo. Mas assim que executamos fora desses três arquivos, que são partes de um arquivo grande, o resultado é fundamentalmente diferente, geralmente catastrófico.
Se treinarmos novamente a cada etapa, o problema de "olhar para frente" será eliminado, pois a previsão é feita com os mesmos valores de previsão do treinamento.
E se não ensinarmos em cada etapa, todos os preditores, inclusive a seção de treinamento, serão ensinados com alguns valores e, em seguida, previstos com base neles. E aqui está a pergunta: os novos valores dos preditores coincidirão com os valores dos preditores no gráfico de aprendizado ou não?
Onde está essa dica que você tem?
Eu o li algumas vezes e não vi a lógica por trás das palavras.
Eles inventam problemas e depois os resolvem heroicamente - um está olhando para o futuro, o outro está procurando a marcação perfeita....