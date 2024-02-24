Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 388

Maxim Dmitrievsky:


Eu já tenho preditores, por estranho que pareça. Eu tenho um robô pronto, que construí em menos de um mês. O mais importante são os preditores, está fora de questão, sim. Bem, isso é quem tem experiência em quê... Por exemplo, com a minha imaginação inflamada os preditores podem ser apanhados num instante, eu trabalho como analista há 5 anos :) Na minha opinião, a seleção de preditores não é uma tarefa tão difícil como estudar arquiteturas NS, o principal é sentar e selecionar, levar 2-3 semanas :)



E em números?

Sobre a amostra de treinamento, a amostra de teste e a amostra de validação.

O mais importante: em um novo arquivo que foi originalmente separado dos três anteriores.

Todos estes quatro valores não devem diferir muito um do outro. Se eles diferirem mais de 10% em erro (30% de desvio e 35% de desvio, por exemplo), então raspe-o.


E o que eu tenho na conta real não tem importância nenhuma - os sinais morrem depois de um ano ou mesmo depois de dois anos.

 
SanSanych Fomenko:

E quanto ao facto de os incrementos não indicarem tendências de forma alguma?

Sim, eles fazem.

Ou o modelo prevê o incremento ou a direção - é para isso que servem os modelos de classificação.

Não tenho conhecimento de nenhum modelo de classificação que reconheça movimentos nas notícias. E para a GARCH este é o objectivo do modelo - trabalhar o movimento ocorrido. Fat tails - este é o movimento nas notícias quando as tendências se quebram e ocorrem inversões bruscas.


Bem, podes ver o aumento em diferentes períodos de tempo.

Existem modelos GARCH interessantes para vários períodos de tempo. O significado é o seguinte.

Suponhamos que prevemos o incremento no H1. O modelo requer dados de entrada que caracterizam a distribuição. Como tais dados de entrada (geralmente volatilidade) não tomamos a hora anterior, mas os minutos dentro da hora atual.

Na minha opinião, é importante dividir a história inteira em intervalos com o mesmo comportamento. Por exemplo, aqui está uma imagem do preço de fecho do EURUSD durante 5 anos, pode ver que houve uma tendência até cerca do 2T14, depois o resto de 14 e início de 15 é outra, e depois disso a terceira começou e ainda continua. Tentar obter a temperatura média no hospital e usá-la para diagnosticar a condição de um único paciente é errado, imho.


Se tomarmos, por exemplo, a tendência actual algures desde o início do século XV até aos nossos dias, e pelo menos isolar/extrapolar as tendências, a periodicidade, obtemos um resultado bastante credível, imho. Aqui está a imagem, em verde é o preço de fecho previsto para as próximas duas semanas.


SanSanych Fomenko:


Eu não preciso de tantas amostras inúteis, há treinamento e testes suficientes, eu escolho parâmetros via AG, depois escolho resultados que são, no máximo, parecidos com o para frente e para trás. Você nunca irá treinar um modelo para todo o histórico de cotações, além de oferecer 3 períodos independentes, e negociar no 4º é um disparate quando se negocia no mercado, pois o mercado muda durante esse tempo. Por isso, certifique-se de que o modelo não está sobre-equipado, numa secção fora da amostra de treino, e é só isso.

Reciclagem todas as semanas, até agora a segunda semana está a +35%. Do que se trata, é dinheiro real )

 
SanSanych Fomenko:

E o que vale o dinheiro real não é nada, há sinais que morrem em um ano ou até dois ...

Quer mesmo criar um modelo de mercado para os próximos anos...?
 
Maxim Dmitrievsky:


Por favor, que preditores você usa?
 
Maxim Dmitrievsky:


Você sabe melhor sobre as amostras.
pantural:
Por favor, diga-me quais são os seus preditores?
Um que já descrevi aqui é o valor da inclinação da linha de regressão e até um exemplo de bot, os outros são um segredo :)
 
Ivan Negreshniy:
Quer mesmo criar um modelo de mercado para os próximos anos...?

Não, claro que não.

Estou ocupado a conseguir algumas garantias para algum futuro.

 
Maxim Dmitrievsky:


Eu também tenho duas parcelas.

A primeira parcela: três amostras são retiradas aleatoriamente e verificadas. A última secção, que segue a primeira, é uma corrida sequencial, de preferência com um testador.

Completamente esquecido, embora eu já tenha escrito muitas vezes.

A etapa descrita acima é a segunda etapa.

O primeiro passo é a seleção de preditores "relevantes" para a variável alvo. Posso provar que resultados muito bons são obtidos por aqueles conjuntos de preditores em que prevalecem os preditores que nada têm a ver com a variável alvo - o ruído -. Os resultados do treino são muito bons em ruído. E eu consegui obter um erro de menos de 10% nas três partes acima mencionadas, baixando para 3%! E depois recebi um erro completamente aleatório na segunda parte.

Se você começar a eliminar os preditores de ruído, o erro aumenta durante o treinamento, mas diminui na segunda seção. Se você se livrar dos preditores de ruído, você recebe aproximadamente o mesmo valor de erro. No meu conjunto de preditores, é um pouco menos de 30%.

 
Não é preciso treinar máquinas, é preciso primeiro ter nervos de ferro e conexões nos escalões superiores do poder para poder comerciar de forma lucrativa.
