Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2878

 
Maxim Dmitrievsky #:

Está claro que podemos tentar usar funções de hash. Mas tenho vergonha de perguntar em que princípio escolher vetores de comprimento arbitrário, ou melhor, o comprimento deles:) e de quais dados.

pode haver muitas variantes

a primeira opção é mais agradável, mas você precisa colocar algo na lógica

Essa é uma pergunta muito importante, estou sempre pensando nela) Vamos falar apenas sobre a extensão do histórico usado. Você precisa de um compromisso razoável entre relevância e duração para os cálculos. Quanto mais curto, mais relevante, mas quanto mais longo, mais precisos serão os cálculos. Às vezes, um bom compromisso é inatingível em princípio.

 
Maxim Dmitrievsky #:

Muito bem, até aprendi algo interessante para mim no contexto da alteração do comprimento das janelas.

Se tiver mais perguntas, faça um esboço delas e eu lhe perguntarei depois do Ano Novo.

Ok, Feliz Ano Novo para todos nós!)

 
Aleksey Nikolayev #:

Ok, Feliz Ano Novo para todos nós :)

Da mesma forma :)

 

Não tenho certeza do que você conseguiu com a conversa sobre GPT.

Às vezes, ele responde a coisa errada. Aqui está um exemplo

В идеале, алгоритм должен получать на вход всю доступную историю, которая очевидно со временем растёт. Он сам должен определять на какие куски её нарезать и что с ними делать.

*Sim, idealmente o algoritmo deve ser capaz de lidar com qualquer número de recursos

Você perguntou sobre a variação do comprimento das linhas, e ele respondeu sobre a variação do comprimento das colunas.

Na prática, o comprimento do histórico pode ser alterado com o retreinamento do modelo. Por exemplo, treinar em 1 dia, 3, 7, mês, 2, ... em 1 ano, 2, 3 ... qualquer que seja o comprimento do histórico que faça uma boa previsão, use-o.
 
Aleksey Nikolayev #:

É uma pergunta muito importante, estou sempre pensando nisso) Vamos falar apenas sobre a extensão do histórico usado. Deve haver um compromisso razoável entre a relevância e a duração dos cálculos. Quanto mais curto, mais relevante, mas quanto mais longo, mais precisos serão os cálculos. Às vezes, um bom compromisso é inatingível em princípio.

Também me perguntei sobre essa questão há muito tempo. Na minha opinião, esse é um dos momentos mais importantes para criar um TS funcional. Para mim, uso esta abordagem: analiso aproximadamente algumas características de um ativo financeiro em um grande histórico conhecido, encontro as coordenadas das tendências de mudança - tendência, volatilidade etc. e, em seguida, trabalho a partir do último ponto de mudança, presumindo que essa característica global permanecerá por algum tempo.

 
elibrarius do comprimento das linhas e ele respondeu sobre a variação do comprimento das colunas.
Na prática, o comprimento do histórico pode ser alterado com o retreinamento do modelo. Por exemplo, treinar em 1 dia, 3, 7, mês, 2, ... em 1 ano, 2, 3 ... qualquer que seja a duração do histórico que faça uma boa previsão, use essa duração.

As colunas ainda não foram discutidas - ainda está muito longe. A confusão se deve à falta de dizer que os sinais são preços (barras, renko, etc.). Ou seja, estamos falando de um comprimento arbitrário de um vetor de atributos homogêneos. Se, além do comprimento arbitrário do vetor de atributos, quisermos ter tipos arbitrários de atributos, já é um claro exagero.

 
Aleksey Nikolayev #:

O problema é que o SB é muito bom em fazer parecer que existem regras - o único problema é que elas serão diferentes em sites diferentes.

Então, se você pensar bem, não é um problema de um número arbitrário de recursos, é um problema de invariância de recursos em primeiro lugar.

https://homes.esat.kuleuven.be/~tuytelaa/tutorial-ECCV06.pdf
 
Aleksey Nikolayev #:

É uma pergunta muito importante, estou sempre pensando nisso) Vamos falar apenas sobre a extensão do histórico usado. Deve haver um compromisso razoável entre a relevância e a duração dos cálculos. Quanto mais curto, mais relevante, mas quanto mais longo, mais precisos serão os cálculos. Às vezes, um bom compromisso é inatingível em princípio.

Você precisa de um critério, e o único critério é o erro de ajuste do modelo.

Aqui está uma imagem


Esta é uma amostra de 2.000 barras, 43 variáveis. Vemos que não faz sentido aumentar o número de árvores acima de 100. Alterei o tamanho da amostra. O resultado é que a imagem não muda acima de 1.500 barras. Isso significa que o número de padrões em meus preditores para meu professor é de cerca de 100 peças e todos eles podem ser encontrados em 1.500 barras de histórico. Além disso, esses padrões se repetem.

 
mytarmailS #:

Então, se você pensar bem, não se trata de um problema de um número arbitrário de recursos, mas sim de um problema de invariância de recursos em primeiro lugar

https://homes.esat.kuleuven.be/~tuytelaa/tutorial-ECCV06.pdf

Se compararmos com o reconhecimento de imagens, é mais ou menos uma questão de encontrar, para cada ponto, o limite do objeto (bolha) no qual esse ponto está localizado.

O problema é que a imagem é de qualidade extremamente ruim e não está muito claro o que de fato está representado nela.

Um objeto pequeno simplesmente não é realista para ser selecionado nessas condições, e um objeto grande será selecionado de forma ambígua.

 
СанСаныч Фоменко #:

Você precisa de um critério, e o único critério é o erro de ajuste do modelo.

Aqui está uma imagem


Esta é uma amostra de 2.000 barras, 43 variáveis. Vemos que não faz sentido aumentar o número de árvores acima de 100. Alterei o tamanho da amostra. O resultado é que a imagem não muda acima de 1.500 barras. Isso significa que o número de padrões em meus preditores para meu professor é de cerca de 100 peças e todos eles podem ser encontrados em 1.500 barras de histórico. Além disso, esses padrões se repetem.

1500 barras é a temperatura média do hospital. Haverá pontos de ruptura, quando as metades do histórico forem muito diferentes e quando for melhor simplesmente não contar e não negociar nada.

Razão: