Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 3166

 
СанСаныч Фоменко #:

Você é simplesmente irritante, guru! Eu não sei quanto a mim, mas você sabe - olhe para o seu mercado!

Você tem alguma coisa além da percepção dolorosa do mundo ao seu redor e da fé sagrada em pacotes, ou o cofrinho está esgotado? )

Todos os dias leio sobre pacotes sobre os quais você não sabe nada.

Ou será que é o Dia da Marmota?
 
Forester #:

é hora de encerrar esse esforço épico de tentar encontrar padrões em dados aleatórios.

Sim.

Ou é hora de parar de pensar em inércia e dar uma olhada sóbria nos resultados.

 
Forester #:

Os resultados do aprendizado por meio do corset geralmente não são ruins

Dos anos 10 a 21, um espartilho foi encontrado com uma fração de 30% (30% do histórico aleatório desse site participou do aprendizado); nos outros anos, em geral, foi puro OOS

No terminal, a aparência é a seguinte


 

Há muitos métodos para determinar o coreset. Aqui estão alguns dos métodos mais populares:

  • Subconjunto aleatório: basta selecionar um subconjunto aleatório de pontos do conjunto de dados original. Essa é a maneira mais fácil de obter um conjunto de núcleos, mas nem sempre oferece a melhor qualidade.
  • Pontos de referência: selecione pontos do conjunto de dados original que tenham um grande impacto na previsão do algoritmo de aprendizado de máquina. Essa é uma maneira mais eficiente de obter um conjunto de núcleo do que um subconjunto aleatório, mas pode ser mais complexa.
  • Agrupamento: agrupe os pontos do conjunto de dados original com base em suas semelhanças. Selecione um ponto de cada grupo como o conjunto principal. Essa é uma maneira eficiente de obter um conjunto de núcleos que represente bem o conjunto de dados original, mas pode ser mais complexa.
  • Kernel hemométrico: selecione pontos do conjunto de dados de origem usando o kernel hemométrico. Esse é um método eficiente de obter um conjunto de núcleos que pode ser usado para melhorar a qualidade dos algoritmos de aprendizado de máquina.
  • Subconjunto aleatório estendido: esse método seleciona pontos aleatórios do conjunto de dados original, mas com maior probabilidade seleciona pontos que têm um alto impacto na previsão do algoritmo de aprendizado de máquina. Essa é uma maneira eficiente de obter um conjunto de núcleos que ofereça boa qualidade e possa ser usado para uma variedade de tarefas de aprendizado de máquina.

É importante observar que não existe uma maneira universal de obter um conjunto de núcleos que seja adequado para todas as tarefas de aprendizado de máquina. A escolha do método para obter o conjunto de núcleos depende da tarefa específica e do recurso computacional disponível.

*Bardo

 
Maxim Dmitrievsky #:

Os resultados do aprendizado com o espartilho geralmente não são ruins

Dos anos 10 a 21, um espartilho foi encontrado com uma fração de 30% (30% do histórico aleatório desse site participou do aprendizado), os anos restantes geralmente foram de puro OOS

No terminal, a aparência é a seguinte


Bem, também há períodos de rebaixamento que duram de seis meses a um ano. Você está preparado para isso? Especialmente se o drawdown começar imediatamente no lançamento em tempo real?

 
Forester #:

Bem, também há períodos de rebaixamento que duram de seis meses a um ano. Você está preparado para isso? Especialmente se o drawdown começar imediatamente quando você começar a investir de verdade?

Normalmente, diversifique.

Esses gráficos serão lucrativos em outros instrumentos. E se a tendência geral de todos eles for a mesma do gráfico apresentado, a estabilidade do investimento estará garantida.

Você só precisa criar um portfólio de instrumentos que criará o maior fator de recuperação
 
Forester #:

Bem, também há períodos de rebaixamento que duram de seis meses a um ano. Você está preparado para isso? Especialmente se o drawdown começar imediatamente quando você começar a investir de verdade?

Não estou pronto para apostar em 20 anos :) isso é mais um estudo de caso.

Estou bem com 10 anos de treinamento - 1 ano de OOS, tudo bem.

mas há muito ruído, às vezes o modelo descarta quase todas as amostras como inúteis, restando 3 transações

Há também partes do histórico que nunca são previstas normalmente.

Em suma, não é uma atividade muito gratificante.

É como girar o receptor antigo e acidentalmente atingir alguma onda com ruído.

 

Mais uma vez, estou convencido de que, para prever, você precisa de um modelo.

O modelo remove o desnecessário (ruído), deixando o necessário (sinal), se possível amplificando o necessário (sinal), bem como o modelo é mais determinístico, mais repetitivo nos padrões....

como exemplo.

preços minutka alto-baixo.


Além disso, construímos a simplificação mais simples do preço (criamos um modelo).

Em seguida, removemos o excesso (aprimoramos o modelo) com a ajuda de um algoritmo simples conhecido para redução de dimensionalidade, o modelo se tornou mais repetitivo.

E o último toque, talvez decorativo.


Gostaria de saber como o MO será treinado com esses dados?

Esta é uma amostra de teste.

Confusion Matrix and Statistics

          Reference
Prediction    -1     1
        -1 24130  2780
        1   4478 23613
                                          
               Accuracy : 0.868           
                 95% CI : (0.8652, 0.8709)
    No Information Rate : 0.5201          
    P-Value [Acc > NIR] : < 2.2e-16       
                                          
                  Kappa : 0.7363          
                                          
 Mcnemar's Test P-Value : < 2.2e-16       
                                          
            Sensitivity : 0.8435          
            Specificity : 0.8947          
         Pos Pred Value : 0.8967          
         Neg Pred Value : 0.8406          
             Prevalence : 0.5201          
         Detection Rate : 0.4387          
   Detection Prevalence : 0.4893          
      Balanced Accuracy : 0.8691          
                                          
       'Positive' Class : -1  

Você já viu números como esse antes?




 
СанСаныч Фоменко #:

Qual é o nome exato? Ou é feito em casa?

Uso diferentes modelos de "madeira" há muitos anos e nunca vi nada parecido com isso.

O que você quer dizer com "caseiro"? Há uma justificativa teórica, um bom artigo. Há um pacote chamado RLTv3.2.6. Ele funciona bem. Você deve prestar atenção à versão.

Sobre o ONNX para modelos de madeira em Python. Consulte o pacote skl2onnx.

Modelos suportados do scikit-learn. O último conjunto de opções suportado é o 15.

Boa sorte

skl2onnx
  • 2023.05.09
  • pypi.org
Convert scikit-learn models to ONNX
 
E o principal homem autodidata e autodidata é Breiman, porque ele não escreveu em R. Ele é um grande idiota.
Razão: