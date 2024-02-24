Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 124
Esta é uma descrição das saídas multivariadas. Fui eu que a implementei. Aumenta a hipótese de um ataque.
O principal problema está no sobretreinamento, quando no futuro as árvores existentes não prevêem corretamente a classe, ou melhor, elas prevêem a classe cada vez pior. Esta é a questão abordada neste tópico, ou seja, tentamos provar que as árvores obtidas irão ocorrer no futuro e que o erro de classificação em amostras futuras será aproximadamente o mesmo que na amostra de treinamento.
Embora esteja implícito, prefiro adicioná-lo para torná-lo mais claro.
Normalmente o sobre-aprendizado em modelos tem o efeito de que o modelo se lembra de exemplos de formação de forma muito precisa. A aprendizagem começa com o modelo derivando de algumas regras gerais, valores-alvo dependentes de preditores, mas quanto mais se vai aprendendo, mais rígidas se tornam estas regras no modelo, levando eventualmente a exemplos completamente memorizados, com completa incapacidade do modelo de predizer sobre novos dados. Isto é tratado por validação cruzada, e parar o treinamento quando o modelo tiver aprendido algumas regras generalizadas mas ainda não tiver começado a aprender exemplos específicos, isto dará um melhor desempenho preditivo sobre novos dados.
Isto funciona muito bem em dados onde as dependências permanecem constantes ao longo do tempo - reconhecimento de imagem, ou reconhecimento de som, por exemplo. Mas forex é diferente na medida em que muitas das dependências encontradas não são persistentes com o tempo. O problema não é apenas aprender sem memorizar exemplos de treino, mas também de alguma forma garantir que os padrões encontrados permanecem no futuro.
A tarefa é mais completa: desenvolver uma forma de estimar os preditores em relação à variável alvo que garanta que a relação entre os preditores e a variável alvo seja constante e que também exista em novos dados.
Quais os valores-alvo a utilizar(cor da barra, ou inversão, ou tendência), ou quais os preditores (preços, indicadores, índices) são as nuances. Se pudermos avaliar o conjunto de preditores e sua capacidade de previsão dos valores-alvo, e a mudança dessa capacidade de previsão no tempo, então podemos até encontrar tais combinações de preditores e valores-alvo, que têm a melhor estimativa.
Então podemos pegar qualquer modelo, treiná-lo (talvez até com controle de requalificação, que é importante para a neurônica, por exemplo), e há um graal.
Parece que somos só nós os dois aqui, pois a posição do Alexey não é totalmente clara para mim.
O resto é a experiência de pessoas que já estão no mercado há muito tempo. Eu acredito que eles são comerciantes de sucesso. Sei pela literatura que algumas pessoas têm tido sucesso usando a heurística por muitos anos, mas o único resultado foi uma monotonia sombria - uma perda do depoimento. Qualquer heurístico não responde à questão da reaprendizagem, é por isso que o fim virá: dentro de um dia, um mês, um ano... mas sempre de forma inesperada e extremamente inoportuna.
PS.
A sobre-aprendizagem é um problema básico da ciência, no sentido em que o tema da ciência é a extracção de algumas leis básicas, das quais muitas particularidades podem ser explicadas.
Por exemplo, a lei de Newton.
Pegue um pedaço de papel - ele é obrigado a cair no chão. Amasse esse pedaço de papel - ele está destinado a cair, mas mais rápido. Newton diz que tudo cai com a mesma aceleração. Como assim? É assim que o homem consegue desfazer-se do particular, que é uma realidade muito, rudimentar e obter uma lei universal, e se ela não funcionar, então esses desvios podem sempre ser explicados.
É assim que a ciência funciona.
O que fazemos é tentar "embrutecer" o quociente, apresentar este quociente sob a forma de um modelo, de modo a ter uma ideia de todos os quocientes futuros.
A luta contra o excesso de formação é um problema básico da negociação.
Um pouco fora de tópico, mas só um pouco de informação...
No reconhecimento de voz em particular na fala é um problema quando uma pessoa diz uma palavra - um padrão espectral da palavra alimentado ao algoritmo "HMM" ou "RNN" ...mas o problema é que se a outra pessoa disser a mesma palavra, pelo menos a uma velocidade diferente, esse padrão é o mesmo mas esticado com o tempo, e agora a analogia - a largura do padrão de cabeça e ombros de 33 velas e a mesma largura do padrão de cabeça e ombros de 88 velas, a largura é diferente, mas o padrão é o mesmo .....
Para resolver o problema com o algoritmo de reconhecimento de fala foi desenvolvido - um dinâmico "DTW" de tempo A tarefa do algoritmo é que ele pode encontrar dois vetores similares, mesmo que tenham comprimentos diferentes. Assim, quando diferentes pessoas dizem a mesma palavra este padrão espectral da palavra passa primeiro pelo "DTW" e depois pelo algoritmo "MO" e a palavra é reconhecida com sucesso. Ainda não o usei, por isso não posso dizer nada, mas acho que vou ter de o experimentar, embora se disser que não existem padrões no mercado, então é claro que este algoritmo não vai funcionar, ainda não decidi com a minha visão de mundo...
Pacotes R: "DTW". "dtwclust".
O método é o seguinte (tudo o que se segue aplica-se igualmente tanto ao ML como ao TS clássico).
A questão é livrar-se da incerteza, o que significa, por um lado, livrar-se do ajuste no treinamento e otimização e, por outro, formular sem ambigüidade os requisitos "suaves" para o sistema. TP e SL na entrada também é uma incerteza, por isso o usamos apenas para saída de emergência (depende da volatilidade do instrumento e selecionamo-lo empiricamente, de modo que 100% das operações são disparadas o mais raramente possível, idealmente - nunca. Prever todo o comércio, da entrada à saída. Consideramos que o resultado com um lucro excluindo o spread e as comissões é uma negociação bem sucedida (o funcionamento do sistema é determinado após verificar se o spread e as comissões são cobertos). Assim que o sinal de entrada é recebido, o sistema entra e depois espera por uma certa quantidade de barras (é determinado empiricamente e depende dos preditores e do instrumento). - Fecha o negócio, se estiver a perder, esperamos por mais um bar. Às vezes uso dois parâmetros: mínimo e máximo (se um comércio não é fechado após o número máximo de barras - é fechado de qualquer forma), e às vezes uso apenas um - o número mínimo de barras.
Muitas pessoas ficarão surpresas, mas muitos, mesmo sistemas aparentemente sem esperança, começam a funcionar, incluindo TS em varinhas, para não mencionar todos os tipos de sistemas com ML. O truque é não exigir de si e da máquina regras de ferro de TC, não tentar descrever completamente os movimentos do mercado e dar aquelas regras muito "suaves" para o ML. Além disso, livramo-nos do mau legado do mercado na forma de caudas pesadas (ou mais precisamente, as caudas deixam de importar), a falta de estacionariedade na BP deixa de importar - porque sabemos que as formas do mercado podem ser escaladas vertical e horizontalmente sem alterar as suas propriedades internas (e isto torna a vida extremamente difícil para os emleoners).
Escrevi sobre isso no 4º fórum, acho que no tópico Swinosaurs, sobre dois tipos de todos os TSs (com limites definidos e indefinidos), mas a idéia não foi completada lá. Agora tudo é mais claramente visível, ou assim...
Em geral, eu uso a minha regra ao desenvolver sistemas de trading: se as mudanças na lógica levam a aumentar a percentagem de variantes de parâmetros bem sucedidos entre todas as variantes possíveis, então é uma boa mudança (a probabilidade de escolher uma variante má para trading é reduzida, não importa como mudamos os parâmetros - estaremos no lado positivo). Esta abordagem permitiu aumentar esta quota no meu TS.
Qual é o hábito selvagem de responder em duas palavras e citar 100 linhas de interlocutor???? O fórum tem 120 páginas. Se você remover estas citações desnecessárias você tem talvez 60 páginas de texto útil... Respeitar as pessoas que o lêem ou que o irão ler no futuro
Você pode descrever ponto por ponto o que e como fazer, como um algoritmo, porque eu não entendo realmente como você sugere fazer
Parece-me que tudo o que descreveu se enquadra na optimização do modelo ARIMA. Durante a otimização é selecionado o número de barras sobre as quais o modelo é construído
Você pode descrever ponto por ponto o que fazer e como fazê-lo, como um algoritmo, porque eu realmente não entendo como você se propõe a fazer isso.
Você está certo sobre o alongamento no tempo dos valores de preços. Era disso que eu estava a falar, alongamento/escala vertical e horizontal. Mas não são apenas os números como um todo que são esticados de forma diferente, mas também os candelabros individuais dentro deles. Este é um problema adicional e duvido quemétodos de pré e pós-processamento do tipo DTW possam ser aplicados adequadamente.Estas são formas de mercado distorcidas de alguma forma desconhecida.
Para ser mais exacto: temos sinal de compra na barra actual, conte o menor número de barras à frente e verifique se o negócio será rentável, se sim - feche-a, se não - conte mais uma barra à frente e volte a verificá-la. E assim atingimos o número máximo de barras e fechamo-las finalmente. Isto é um mecanismo de aprendizagem.
Em geral, a aprendizagem de dados de mercado pela máquina é semelhante ao seguinte: mostramos à máquina uma combinação de formas gráficas, círculos, quadrados, triângulos, trapézios, formas de diferentes tamanhos e formas. A máquina tem de responder com alguma forma, um triângulo um quadrado ou um círculo (exagerado). Nós colocamos a resposta para o modelo e f*ck! - A forma na resposta não corresponde à merda do modelo! E no processo de aprendizagem, por alguma razão, eles combinaram como a merda de uma pedra. .... Esse é o tipo de problema que estamos a resolver aqui. E eu digo - sem problemas, podemos esticar um pouco o padrão, para que as respostas se tornem corretas mesmo fora dos dados do treinamento.
É um "peixe" básico de um sistema, que já está a funcionar por si só. Mas ninguém proíbe a adição ao TS e o uso em negociação de ferramentas como o SL Breakeven. O sistema permanece o mesmo, mas para isso, quando o mercado se mover na nossa direcção, vamos obter lucros extra para além do "plano" e depois ou arrasto SL, ou iniciar o encerramento parcial de posições, dependendo da distância percorrida em comparação com o movimento estatístico de preços durante um determinado período de tempo, etc.
Está a aumentar? É estranho. Mas diminui.
Você avalia o desempenho da estratégia na história ou há um longo avanço? O diabo pode estar na avaliação da história.
Olha, eu tinha uma estratégia escrita em 100 linhas em MT4 sozinha. Eu escrevi sobre isso no meu perfil em dezembro de 2014:https://www.mql5.com/ru/users/alexeymosc/page3?#userActions
É este o aspecto da última versão, elaborada em Janeiro de 2015:
Eu então experimentei o real, em conjunto com outras estratégias. Eu também escrevi sobre eles em todo o lado.
Isto e aquilo, a mão drenou-o.
Vi hoje um teste prospectivo desde o final da optimização até ao final de Julho com as mesmas configurações. Olha:
Está tudo aí. Spread é 30, lote 0.1.
Vou tentar em todas as carraças também, para ter a certeza que as tomadas funcionam melhor:
Entrada por impulso, saída via OU em várias condições. Em princípio, parece funcionar. Mas se eu entrar no pico, então espere um ano para desistir de um sorteio...