Discussão do artigo "Criação de uma estratégia de retorno à média com base em aprendizado de máquina"

 

Novo artigo Criação de uma estratégia de retorno à média com base em aprendizado de máquina foi publicado:

Neste artigo, é proposto um novo método para criar sistemas de trading baseados em aprendizado de máquina, utilizando clusterização e anotação de trades para estratégias de retorno à média.

Antes de clusterizar qualquer coisa, é preciso entender por que isso é necessário. Imagine um gráfico de cotações que contenha tendência, lateralidade, períodos de alta e baixa volatilidade, diferentes padrões e outras características. Ou seja, o gráfico de cotações não é algo homogêneo, com as mesmas regularidades o tempo todo. Pode-se até dizer que, em diferentes períodos de tempo, existem ou podem existir diferentes regularidades que desaparecem em outros intervalos temporais.

A clusterização permite dividir a série temporal original em vários estados com base em determinados atributos, de modo que cada estado descreva observações semelhantes. Isso pode facilitar a construção de um sistema de trading, já que o treinamento ocorrerá com dados mais homogêneos e consistentes. Pelo menos é o que se pode imaginar. Naturalmente, o sistema de trading não funcionará em todo o período histórico, mas em uma parte selecionada, composta por diferentes momentos cujos valores de atributos pertencem a um determinado cluster.

Após a clusterização, é possível anotar apenas os exemplos selecionados, ou seja, atribuir a eles rótulos de classes únicos para a construção do modelo final. Se um cluster contiver dados homogêneos com observações semelhantes, sua anotação também tende a se tornar mais uniforme e, consequentemente, mais previsível. Podemos pegar vários clusters de dados, anotar cada um separadamente, treinar modelos de aprendizado de máquina com os dados de cada cluster e testá-los tanto nos dados de treinamento quanto nos de teste. Se um cluster permitir que o modelo aprenda bem, ou seja, generalize e faça previsões em novos dados, a tarefa de construir o sistema de trading pode ser considerada praticamente concluída.


Autor: Maxim Dmitrievsky

 

Não é nada crítico, mas ainda assim gostaria de não ter nenhum jogo de guerra fora da caixa.

 

A principal diferença entre o filtro Savitsky-Golei e a média móvel usual é que ele não fica defasado em relação aos preços.

É um erro usar esse filtro on-line em séries temporais não estacionárias, pois os últimos valores podem ser redesenhados, mas ele é bastante adequado para marcar negociações em dados existentes.

Por que não o ZZ?


É verdade, encontrei uma pequena explicação.

Essa marcação tem suas próprias peculiaridades:

  • nem todas as negociações marcadas são lucrativas, porque as mudanças de preço posteriores, depois de cruzar as fitas, nem sempre vão na direção oposta. Portanto, pode haver exemplos que são falsamente marcados como compra ou venda.
  • Em teoria, essa desvantagem é compensada pelo fato de que a marcação é homogênea e não aleatória e, portanto, os exemplos falsamente marcados podem ser considerados como erros no treinamento ou no sistema de negociação como um todo, o que pode resultar em menos retreinamento na saída.
Provavelmente, a retirada de alguns vértices da linha ZZ teria o mesmo efeito.
[Excluído]  
fxsaber #:

Então, por que não o ZZ?


No entanto, encontrei uma pequena explicação.

Provavelmente, jogar alguns vértices para fora da linha ZZ teria o mesmo efeito.
Nunca usei o zz, obrigado pela ideia. Vou escrever um sampler desse tipo.
[Excluído]  
fxsaber #:

Não é nada crítico, mas ainda assim gostaria de não ter nenhum jogo de guerra fora da caixa.

Eu me esqueci disso, vou guardá-lo.
 
A assimetria (ou skewness) em distribuições é uma característica que descreve o grau em que a distribuição de dados é assimétrica em relação à sua média. A assimetria indica o quanto uma distribuição se desvia de uma distribuição simétrica (por exemplo, uma distribuição normal). A assimetria é medida usando o coeficiente de assimetria (skewness). Кластеризация по скосу permite identificar grupos de dados com características de distribuição semelhantes, o que ajuda a identificar esses modos. Por exemplo, uma assimetria positiva pode indicar períodos com picos de preços raros, mas grandes (por exemplo, durante crises), enquanto uma assimetria negativa pode indicar períodos com mudanças mais suaves.

Talvez eu esteja vendo as coisas superficialmente, mas o agrupamento por inclinação não é uma espiada no futuro?

Eu achava que o agrupamento do mercado deveria ser feito por características em tempo real: tempo, deslizamento, etc.

[Excluído]  
fxsaber #:

Talvez eu esteja vendo as coisas superficialmente, mas o agrupamento de chanfros não é uma visão do futuro?

Eu achava que o agrupamento de mercado deveria ser feito por atributos em tempo real: tempo, deslizamento, etc.

Os chanfros são para as últimas n barras (10 no artigo), ou seja, em uma janela deslizante.
 
Maxim Dmitrievsky #:
Níveis para as últimas n barras (10 no artigo), ou seja, em uma janela deslizante.

O cluster correspondente inclui o que está à direita dessas 10 barras ou essas mesmas barras?

[Excluído]  
fxsaber #:

O cluster adequado inclui o que está à direita dessas 10 barras ou dessas mesmas barras?

10 barras atrás, a partir da atual. Caso contrário, nem mesmo no testador MT5 isso corresponderia, porque ele não vê o futuro :)

A lógica é a mesma do loop no encludnik. Caso contrário, as leituras dos testadores seriam divergentes (a minha e a do MT5)
 
Maxim Dmitrievsky #:
10 barras atrás da atual. Caso contrário, mesmo no testador do MT5, não haveria correspondência, porque ele não vê o futuro :)

Parece lógico. Aparentemente, nós nos entendemos mal.

 
  • catmodel EURGBP_H1 0.onnx  — основная модель, которая дает сигналы на покупку и продажу
  • catmodel_m EURGBP_H1 0.onnx  — дополнительная модель, которая разрешает или запрещает торговлю

Terminei de ler até este ponto e não entendi qual era a origem.