Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2017

 
mytarmailS:

Alguém já tentou usar "níveis redondos" como sinais?

Ou como uma forma de processar os preços ?

Você pode marcar preços com valores circulares, por exemplo...

É possível remover valores que são os mesmos numa fila...

É uma boa compressão de informação, mais filtragem ... Talvez seja mais fácil procurar padrões em tal gráfico para um modelo ...

Eu planejo fazer preditores, a lógica aqui é que há greves de opções em níveis, por isso pode ser útil para Moex.

Os gráficos são interessantes, a MQL gostaria de obter um algoritmo rápido...
 
Aleksey Vyazmikin:

Sobre interferência - talvez precisemos de mudar a forma como o erro é corrigido.

Porquê caixa negra, se existem apenas 2-3 camadas, então é bastante realista desembaralhar por coeficientes. Pequenos coeficientes aqui podem ser grosseiros e zerados, o que reduzirá o número de entradas para o neurônio.

O que você quer dizer com "talvez você deva mudar"? Aprenda a matemática e como funcionam as fontes de ativação. Ou os desenvolvedores da rede são tão burros que não saberiam

Porquê entrar em tudo isto e reinventar a roda sem um diploma ou formação matemática? É uma estúpida perda de tempo. Existem tecnologias e está escrito como elas devem ser usadas.

 
Maxim Dmitrievsky:

O que você quer dizer com "pode precisar mudar"? Aprenda a matemática e como funcionam as funções de ativação. Ou os desenvolvedores da rede são tão burros que não teriam descoberto

porque é uma perda de tempo, nada mais do que especulação e zero especificidades. Você acabou de ajustar o autocodificador, adicionou hotkeys a um grupo ou NS e nos mostrou os resultados. E é tudo. Não tens de elaborar nada. Arquiteturas profundas não são construídas para serem analisadas, mas para reduzir a rotina analítica.

Por que mesmo entrar em tudo isso e reinventar a roda sem um diploma ou formação matemática? É uma estúpida perda de tempo. Existem tecnologias e está escrito como elas devem ser usadas, só isso. Muita gente está a trabalhar nisso.

Se as soluções prontas e prontas resolvessem as tarefas que lhes estabeleci, eu não teria de inventar nada.

Agora eu estou preparando uma grande amostra e vou treinar muitos modelos no CatBoost, tenho algumas idéias de como estimar a qualidade do modelo para uma aplicação mais bem sucedida em tempo real - eu vou compartilhar os resultados da minha pesquisa.

 
Aleksey Vyazmikin:

Se soluções prontas, fora da caixa, resolvessem as tarefas que eu lhes apresentei, não havia necessidade de inventar nada, mas, infelizmente, não havia necessidade de inventar nada.

Agora eu preparo a grande amostra e vou treinar muitos modelos no CatBoost, há idéias de como estimar a qualidade do modelo com o objetivo de sua aplicação em tempo real - eu vou compartilhar os resultados da pesquisa.

Não acho que o catboost seja a melhor solução para a previsão de séries temporais, ele não funciona com sequências.

você pode brincar com a classificação, mas será inútil
 
Maxim Dmitrievsky:

Catbust não é adequado para a previsão de séries temporais, não funciona com sequências

apenas para brincar com a classificação, mas é inútil

E como você determina se funciona ou não?

Eu tenho modelos que são rentáveis durante um ano (treinados há cerca de um ano) no testador - você está sugerindo que eles são aleatórios?

Sim, o CatBoost é inferior a uma árvore genética com folhas de pós-processamento, mas é muito rápido de treinar.

E o que funciona - NS?

 
Aleksey Vyazmikin:

Como se pode saber se está a funcionar ou não?

Tenho modelos que são rentáveis há um ano (treinados há cerca de um ano) no testador - está a sugerir que são uma casualidade?

Sim, o CatBoost é inferior a uma árvore genética com folhas de pós-processamento, mas é muito rápido de treinar.

E o que funciona - NS?

Eu não o defini, a arquitectura em si é para outras tarefas.

Sim, é tudo aleatório.

nada funciona ainda )

 
Aleksey Vyazmikin:

Os preditores não são preços em forma nua - muitos pontos relativos que podem ser semelhantes...

Não tenho a certeza se a triagem por correlação seria eficaz...

Porque não tentar? Um resultado negativo é também um resultado (no sentido de alimento para reflexão).

Uma vez até sugeri a fórmula do coeficiente de correlação: C = (n1 - n2)/n, onde n é o número de barras onde pelo menos um dos dois sistemas dá o sinal do comércio, n1 é o número de barras onde os sinais são dados pelos dois sistemas simultaneamente e na mesma direcção, e n2 é o número de barras onde os sinais são dados pelos dois sistemas simultaneamente e em direcções opostas.

Esta matriz pode ser usada para agrupamento, desbaste e formação de portfólio.

 
Maxim Dmitrievsky:

Eu não o determinei, mas a arquitectura em si é para outras tarefas.

Sim, é tudo aleatório.

até agora nada funciona )

Claro que aqui não há séries cronológicas afiadas, por isso os preditores devem conter informações de coordenadas X, não apenas informações de coordenadas Y.

Se aprendermos a identificar tais padrões aleatórios, seremos profissionais.

Tenho mais de 60% das folhas amostradas nos anos anteriores trabalhando, o que é muito, e na minha opinião, confirma a solidez da idéia de uma abordagem de processamento de dados mal classificada. Se mais pessoas trabalhassem na ideia, o resultado seria melhor, mas todos têm a sua bengala.

 
Aleksey Vyazmikin:

Naturalmente, não há aqui afiação de séries temporais, por isso os preditores devem conter informações de coordenadas X, não apenas informações de coordenadas Y.

Se alguém aprender como identificar tais padrões aleatórios, será um lucro.

Tenho mais de 60% das folhas amostradas nos anos anteriores trabalhando, o que é muito, e na minha opinião, confirma a solidez da idéia de uma abordagem de processamento de dados mal classificada. Se mais pessoas estivessem trabalhando na idéia, o resultado seria melhor, mas todos têm a sua bling.

Tipo, o artigo queria... Esboce a essência da abordagem. Eu ainda não entendo o que você está fazendo :D

Mantenho a visão de que as características devem ser extraídas automaticamente pelo próprio modelo da série temporal (se houver alguma). E não há necessidade de fazer nada manualmente. Os incrementos são suficientes. A questão é a arquitectura. Por exemplo, como na PNL (processamento da linguagem neural), a própria rede neural determina o contexto em sequências de palavras, ou seja, a relação entre amostras de séries temporais.

 
Aleksey Nikolayev:

Porque não tentar? Um resultado negativo é também um resultado (no sentido de alimento para reflexão).

Creio que uma vez até sugeri a fórmula para o coeficiente de correlação: C = (n1 - n2)/n, onde n é o número de barras onde pelo menos um dos dois sistemas dá um sinal para o trading, n1 é o número de barras onde os sinais são dados pelos dois sistemas simultaneamente e na mesma direcção e n2 é o número de barras onde os sinais são dados pelos dois sistemas simultaneamente e em direcções opostas.

A matriz destes rácios pode ser utilizada para agrupamento, desbaste e formação de carteiras.

O que é que isto tem a ver com os preditores?

Eu faço algo semelhante para a seleção de folhas, mas há um senão: o número de respostas das folhas é diferente na amostra e devemos levar em conta que folhas com respostas semelhantes, mas de comprimento diferente, podem pertencer ao mesmo grupo.

Razão: