Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 3171

 
Aleksey Vyazmikin #:

O resultado mudará significativamente nas amostras de teste/exame se o preço for selecionado aleatoriamente na primeira iteração?

Eu mesmo responderei: sim, mudará.

Selecionei aleatoriamente o primeiro segmento quântico para excluir o sinal (string) 1.000 vezes.

Aqui estão alguns exemplos de gifs, como o processo foi realizado com diferentes iterações aleatórias do primeiro quantum (pode ser folhas).


E aqui estão imagens estáticas no momento da iteração intermediária - diferentes estágios de seleção e randomização.

Que conclusão pode ser tirada?

1. Você pode ter sorte e encontrar aleatoriamente um padrão funcional :)

2) Sem reduzir o número de padrões falsos, é difícil criar um modelo usando apenas o princípio da ganância.

3. você precisa desenvolver métodos para estimar a regularidade observada em um segmento ou folha quântica.

4. A aleatoriedade não prova que alguém seja bem-sucedido no aprendizado de máquina.

5. É necessário um modelo logicamente válido para ser bem-sucedido.

6. O sucesso em uma amostra de teste nem sempre significa sucesso em uma amostra de exame e vice-versa.

Que outras conclusões podem ser tiradas?

 
Aleksey Vyazmikin #:
...

Que conclusão pode ser tirada?

1. Você pode ter sorte e encontrar aleatoriamente um modelo funcional :)

2) Sem reduzir o número de padrões falsos, é difícil criar um modelo usando apenas o princípio da ganância.

3. você precisa desenvolver métodos para estimar a regularidade observada em um segmento ou folha quântica.

4. A aleatoriedade não prova que alguém seja bem-sucedido no aprendizado de máquina.

5. É necessário um modelo logicamente válido para ser bem-sucedido.

6. O sucesso na amostra de teste nem sempre significa sucesso na amostra de exame, e vice-versa.

Que outras conclusões podem ser tiradas?

Perdi de vista seu método de quantificação no decorrer da discussão, desculpe, lembre-me.

a quantificação de séries temporais é muito importante, por exemplo, ao quantificar um preço pelo método renko, obteremos SB (pelo menos estatisticamente relevante), de modo que a expressão "quantifique-o, não quantifique-o, você ainda obterá xxx" parece, no mínimo, subestimada, porque se há uma quantificação que destrói informações, então provavelmente há uma quantificação que extrai informações. desde que haja informações no fluxo de carrapatos, é claro (esperamos fervorosamente que haja, pois, caso contrário, a aplicação do MO não faria sentido).

 

Andrey Dik #:

Ao quantificar o preço usando o método renko, obtemos o SB (pelo menos estatisticamente relevante)

Acho que não há mais SB do que apenas barras.

Andrey Dik #: desde que haja informações no fluxo de ticks, é claro (esperamos fervorosamente que sim, porque, caso contrário, o uso do MO não faria sentido).
Acho que ninguém investigou os ticks aqui usando o MO ainda.
 
Forester #:

Acho que não há mais SB do que apenas barras.

Acho que um SB muito maior, pois as estatísticas das barras são muito diferentes do desempenho do SB

Forester #:

Acho que ninguém aqui explorou o tiki com MO ainda.

Em voz alta, talvez não, pelo menos não quantificando a série.

 

Parece promissor agir "pelo método contrário", ou seja, buscar não as regularidades, mas os estados da série de preços (ticks) (não quero usar "séries temporais"), que nunca são alcançáveis e não ocorrem na história.

Isso permitirá usar as condições de limite para criar uma estratégia favorável aos traders.

 
Andrey Dik #:

No decorrer da discussão, desculpe, esqueci o método de sua quantificação.

O conceito de "ponto de corte quantificado" é simples - é o intervalo do preditor, que tem um valor numérico em cada linha da amostra. Qualquer coisa dentro do intervalo se torna uma unidade.

Os métodos de particionamento em intervalos podem ser diferentes, e eu uso as duas variantes criadas no CatBoost (em bousting, frequentemente usadas para reduzir a RAM necessária e reduzir a dimensionalidade) e algumas das minhas próprias, por exemplo, diferentes sequências numéricas.

Depois que o preditor é dividido em intervalos usando a grade obtida de uma forma ou de outra, cada segmento é tomado por sua vez e avaliado quanto ao valor das informações nele contidas.

Uma mudança na probabilidade de pertencer a uma classe em 5% ou mais em relação ao valor médio da amostra é considerada uma informação valiosa, assim como o número de sinais e sua distribuição na amostra são levados em conta.

Se a amostra tiver um alvo binário, obteremos dois grupos de segmentos quânticos, nos quais a probabilidade de acertar 0 ou 1 é deslocada de acordo.

Criamos uma nova amostra, em que cada segmento quântico tem sua própria coluna: se houver um sinal no intervalo, coloque "1"; se não houver, coloque "0".

 
O que o impede de transformar/quantificar uma série como eu fiz aqui https://www.mql5.com/ru/forum/86386/page3166#comment_48559717. ou algo semelhante.
ou algo semelhante, e obter um bom resultado.
 
Aleksey Vyazmikin #:

A resposta é sim, isso acontecerá.

Fiz uma escolha aleatória do primeiro segmento quântico para excluir o sinal (string) 1000 vezes.

Aqui estão alguns exemplos de gifs, como o processo foi realizado com diferentes primeiros segmentos quânticos aleatórios (podem ser folhas).


E aqui estão imagens estáticas no momento da iteração intermediária - diferentes estágios de seleção e randomização.

Que conclusão pode ser tirada?

1. Você pode ter sorte e encontrar um modelo funcional ao acaso :)

2) Sem reduzir o número de padrões falsos, é difícil criar um modelo usando apenas o princípio da ganância.

3. você precisa desenvolver métodos para estimar a regularidade observada em um segmento ou folha quântica.

4. A aleatoriedade não prova que alguém seja bem-sucedido no aprendizado de máquina.

5. É necessário um modelo logicamente válido para ser bem-sucedido.

6. O sucesso na amostra de teste nem sempre significa sucesso na amostra de exame, e vice-versa.

Que outras conclusões podem ser tiradas?

Você poderia concluir que está fazendo besteira há alguns anos. Ou você poderia ter feito apenas uma amostragem aleatória, como está fazendo agora.
 
Aleksey Vyazmikin #:

Uma mudança na probabilidade de pertencer a uma classe em 5% ou mais em relação à média da amostra é considerada uma informação valiosa, assim como o número de sinais e sua distribuição na amostra.

Na minha opinião, isso se parece com pi-hacking, sobre o qual Maxim escreveu recentemente. A menos que alguns testes estatísticos sejam usados para determinar a significância dos quanta alocados, definitivamente é ele.

Certa vez, dei um exemplo simples quando a melhor hora da semana para negociação foi selecionada no SB (quando ela obviamente não existe). Havia apenas 5*24=120 variantes, mas foi o suficiente para que essa hora fosse sempre encontrada (o intervalo de tempo era de meio ano, eu acho). Também existe uma "estabilidade de amostragem".

 
Andrey Dik #:

Parece promissor agir "pelo método contrário", ou seja, buscar não as regularidades, mas os estados da série de preços (ticks) (não quero usar "séries temporais"), que nunca são alcançáveis e não ocorrem na história.

Isso permitirá usar as condições de limite para criar uma estratégia favorável aos traders.

A única abordagem válida na análise de séries temporais é a busca de padrões e a exclusão de valores discrepantes :) por qualquer meio.

Se ela for definida como uma série atemporal ou não for uma série, mas, digamos, uma pilha ou um monte, pode haver outras opções 😁
Razão: