Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2727

 
Aleksey Nikolayev #:

Suas suposições parecem muito fortes. No sentido de que, se fosse possível implementá-las, isso seria praticamente um milagre. Eu gostaria de resolver um problema mais modesto e específico: encontrar uma maneira geral de encontrar um meio-termo entre a extensão suficiente da trilha e a ausência de exemplos obsoletos nela.

Em minha opinião, essa questão é fundamental para as aplicações de MO e matstat em nosso campo.

Você não tentou experimentalmente? Afinal, de acordo com sua abordagem teórica a essa questão, após um aumento crítico no tamanho da amostra, os padrões na amostra serão antigos, não funcionarão mais, o que significa que o aprendizado deve se deteriorar em um sentido qualitativo e os resultados em novos dados serão piores quando a amostra for aumentada.

 
Aleksey Nikolayev #:

Obtemos uma análise a posteriori de um modelo já treinado. Eu gostaria de complementá-la com uma análise a priori para o estágio de seleção da amostra de treinamento.

Também acho que sim. Decidi usar o último topo formado do ziguezague para simplificar, mas gostaria de algo mais elaborado.

Começo a extrair apenas as partes funcionais dos novos dados e aplico um filtro na forma de um segundo modelo para trabalhar com dados antigos e novos e, em seguida, verifico-o em outros dados novos, como no artigo.

Também é um tipo de ajuste, mas com base nos erros do modelo. Como se selecionássemos pelo menos as variantes que ele é capaz de classificar bem, então há algo nelas além da aleatoriedade (pelo menos no treinamento e na validação e em alguma outra validação).

Se, a priori, estabelecermos algo, provavelmente faz sentido usar qualquer monitoramento de longa duração, pois ele fornecerá pelo menos alguma marcação adequada. Perceba os sinais.


Eu criei um novo spammer de recursos e alvos (parece ser informativo, e é, em comparação com a amostragem aleatória usual). Mas há algumas variantes, ainda não testei.

 
Aleksey Vyazmikin #:

Você não tentou fazer um experimento? Afinal, de acordo com sua abordagem teórica nessa pergunta, após um aumento crítico no tamanho da amostra, os padrões na amostra ficarão velhos, não funcionarão mais e, portanto, o aprendizado deverá se deteriorar em um sentido qualitativo e, com novos dados, os resultados serão piores quando a amostra for aumentada.

Você provavelmente sabe que é uma tarefa computacional completamente imensa treinar em um grande número de variantes para a duração do histórico para um grande número de pontos no tempo. Mesmo que, por algum milagre, você consiga coletar todas essas estatísticas, haverá uma questão de sistematização significativa dessa pilha de informações. Certamente, uma duração diferente do histórico acabará sendo a ideal para cada momento. E como interpretar isso e, o mais importante, como extrapolar para o futuro?

Eu gostaria de fazer o caminho inverso, ou seja, criar algumas heurísticas para reduzir drasticamente o número de variantes em relação à duração do histórico de treinamento (literalmente, para apenas algumas variantes).

 
Maxim Dmitrievsky #:

Começo a extrair apenas partes de trabalho dos novos dados e aplico o filtro como um segundo modelo para trabalhar com dados antigos e novos e, em seguida, verifico-o em outros dados novos, como no artigo.

Também é um tipo de ajuste, mas com base nos erros do modelo. Como se selecionássemos pelo menos as variantes que ele é capaz de classificar bem, então há algo nelas além da aleatoriedade (pelo menos no treinamento e na validação e em alguma outra validação).

Se, a priori, estabelecermos algo, provavelmente faz sentido usar qualquer monitoramento de longa duração, pois ele fornecerá pelo menos alguma marcação adequada. Pegue os sinais.


Eu criei um novo spammer de recursos e alvos (parece ser informativo e, portanto, é comparado à amostragem aleatória usual). Mas há algumas variantes, ainda não testei.

Terei que refletir sobre isso. Realmente não entendo como traduzir isso em minhas próprias ideias e conceitos.

 
Aleksey Nikolayev #:

Tenho que pensar sobre isso. Realmente não entendo como traduzi-lo para a linguagem de minhas percepções e conceitos.

Além disso, a mudança de ticks para barras reduz muito o poder de previsão.

mas elimina possíveis conflitos com o dts).

 
Maxim Dmitrievsky #:

Além disso, a mudança de ticks para barras reduz muito a capacidade de previsão

mas elimina possíveis conflitos com o dts :)

A propósito, essa também é uma questão prática importante e uma questão teórica interessante. Você pode formulá-la como uma dependência do spread bid-ask real em relação ao volume (liquidez, volatilidade), calcular a regressão correspondente, comparar o forex com os instrumentos da bolsa de valores etc. Outra coisa é que isso é interessante apenas para aqueles cujos TSs negociam grandes volumes)

 
Aleksey Nikolayev #:

Você provavelmente já percebeu que é uma tarefa computacional absolutamente imensa treinar um grande número de variantes para um grande número de momentos no tempo durante todo o histórico. Mesmo que, por algum milagre, você consiga coletar todas essas estatísticas, haverá uma questão de sistematização significativa dessa pilha de informações. Certamente, uma duração diferente do histórico acabará sendo a ideal para cada momento. E como interpretá-la e, o mais importante, como extrapolá-la para o futuro?

Eu gostaria de fazer o caminho inverso: criar algumas heurísticas para reduzir drasticamente o número de variantes para a duração do histórico de treinamento (literalmente para poucas variantes).

O problema com o experimento é solucionável, já fiz algo semelhante.

Naquela época, tive a ideia de que deveria procurar métodos para estimar a comparabilidade da amostra. Mas não consegui implementá-lo, pois não entendia a fórmula.

 
Aleksey Vyazmikin #:

O problema com o experimento é solucionável, já fiz algo semelhante.

Tecnicamente, ele é bastante solucionável, provavelmente. A questão é como interpretar os resultados desse experimento.

Aleksey Vyazmikin #:

Na época, tive a ideia de que deveríamos nos aprofundar nos métodos de avaliação da comparabilidade de uma amostra. Mas não consegui perceber isso - não entendi a fórmula.

O Matstat tem vários testes para verificar a homogeneidade das amostras, por exemplo. Se é claro que entendi sua terminologia corretamente.

 
Aleksey Nikolayev #:

A propósito, essa também é uma questão prática importante e uma questão teórica interessante. Ela pode ser formulada como uma dependência do spread bid-ask real em relação ao volume (liquidez, volatilidade), calcular a regressão correspondente, comparar o forex com os instrumentos da bolsa de valores e assim por diante. Outra coisa é que isso só é interessante para aqueles cujos TS negociam grandes volumes.)

Ah, é uma bagunça tão grande que nada fica claro. De onde eles obtêm essas cotações com volumes, quais são os fornecedores, se eles existem ou não e tudo o mais. No final, mesmo que consigam, eles banirão esse ts tóxico como todos os outros com princípios semelhantes. Ou correrão para diferentes lugares com um chapéu e coletarão o que cair nele antes do pêndulo mágico

Bem-vindo TS a partir de uma hora de duração da transação, é possível em vários instrumentos, eles parecem não ser particularmente difíceis em termos de toxicidade, mas é difícil fazer isso, provavelmente porque eles não se esforçam.
 
Maxim Dmitrievsky #:
Oh, é uma bagunça tão grande que chega a ser incompreensível. De onde eles tiram essas cotações com volumes, que fornecedores usam, se eles existem ou não e tudo mais. No final, mesmo que dê certo, eles banirão esse TS tóxico como todos os outros com princípios semelhantes

Acho que o fxsaber escreveu que os problemas começam com alguns grandes volumes de negócios. Talvez seus TSs tenham sido vítimas de uma popularidade muito alta entre os copiadores)

Razão: