Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2780

 
СанСаныч Фоменко #:

Não há caminhos fáceis aqui.

Os sistemas são determinísticos, estocásticos e incertos, que em diferentes momentos se comportam como estocásticos, determinísticos ou uma mistura deles.

Os mercados financeiros são classificados como incertos porque a fonte de estocasticidade são as pessoas cujo comportamento não é previsível. Por exemplo, o fluxo de pessoas completamente aleatórias no metrô é perfeitamente descrito pela teoria do serviço de massa, tudo pode ser calculado. Mas se você furar um balão e gritar "bomba", o caos se instalará e nada poderá ser calculado. Nos mercados, isso é novo, não há abordagens, nem ciência, e o pânico é esmagado administrativamente.

A seção estocástica dos mercados financeiros também é dividida em dois tipos: estacionária e não estacionária. A estacionária é perfeitamente calculável, não há ciência em princípio. Há mercados financeiros em que os modelos para mercados estacionários funcionam. Já vi modelos ARIMA para o Ministério das Finanças dos EUA - funcionam perfeitamente bem.

Mas, em geral, os mercados financeiros não são estacionários, há algo pronto, mas rapidamente se descobre que não está claro o que fazer - isso é ciência. Mas o que sabemos de fato é uma matemática absolutamente frenética, que se divide em dois tipos:

  • modelagem estatística - modelos GARCH que tentam capturar todas as sutilezas da não estacionariedade;
  • MOEs, que procuram automaticamente por padrões. Em uma floresta aleatória (RF), não há mais do que 150 desses padrões (árvores).

Não há uma maneira fácil, além disso, você sempre ficará preso em algo (notícias), do qual não pode nem se aproximar. Embora isso não seja novidade, não é possível resolver todos os problemas, ou seja, criar um TS estável e lucrativo em cada uma das abordagens acima.


Se você for bem-sucedido em AT, então cuspa em todo o resto. O MO, assim como o GARCH, é para anos.

Obrigado pela apresentação sistemática das informações.

Sim, passei muito tempo em minha própria sistematização de ondas. Muitas pessoas não entendem esse tópico, mas ele funciona de forma estável. Depois, passei para o OHLC. Lá, também, encontrei muitas informações sistemáticas interessantes. O MO é interessante em termos de conhecimento adicional e de revelar as regularidades dos mercados e, mais precisamente, os resultados da economia mundial na forma de gráficos. Há tantas coisas interessantes lá que nem sei dizer. Será que ninguém está vendo isso? Não há ninguém com quem discutir isso seriamente. )))))))

 
Uladzimir Izerski #:

Obrigado pela apresentação sistemática das informações.

Sim, dediquei muito tempo à minha própria sistematização das ondas. Muitas pessoas não entendem esse tópico, mas ele funciona de forma estável. Depois, passei para o OHLC. Lá, também, encontrei muitas informações sistemáticas interessantes. O MO é interessante em termos de conhecimento adicional e de revelar as regularidades dos mercados e, mais precisamente, os resultados da economia mundial na forma de gráficos. Há tantas coisas interessantes lá que nem sei dizer. Será que ninguém está vendo isso? Não há ninguém com quem discutir isso seriamente. ))))))

Uma coisa é ver e outra é escrever/combinar o código.

 
Nos sistemas clássicos, o problema é a flexibilidade insuficiente; no MO, o problema é a flexibilidade excessiva. É necessário selecionar dados e treinar novamente ambos. Até mesmo o tamanho da amostra e a frequência de treinamento são +- os mesmos. Somente o MO exige muito mais potência e uma "caixa preta". No Onyx, em 2010, eles colocaram tudo na rede e, desde então, a capacidade aumentou em ordens de magnitude, mas ainda está lá.
 
СанСаныч Фоменко #:

Pela centésima vez, pelo grau de conexão informacional

A informação mútua é adequada para isso?

https://scikit-learn.org/stable/modules/generated/sklearn.feature_selection.mutual_info_classif.html

 
Rorschach #:
Nos sistemas clássicos, o problema é a flexibilidade insuficiente; no MO, o problema é a flexibilidade excessiva. É necessário selecionar dados e treinar novamente ambos. Até mesmo o tamanho da amostra e a frequência de treinamento são +- os mesmos. Somente o MO requer muitas vezes mais potência e uma "caixa preta". No Onyx, em 2010, eles estavam colocando tudo na rede. Desde então, as capacidades aumentaram em ordens de magnitude, mas ainda estão lá.

Por que todo mundo está cavando fundo quando tudo está na superfície, nos gráficos?

É claro que não existe uma constância perfeita dos locais exatos, por exemplo, das reversões de preço. Nunca haverá nenhuma. Mas a previsibilidade do comportamento dos preços não é perdida por causa disso. A precisão pode cair, mas não a previsibilidade. Há modelos inter-relacionados de mercados e não há como escapar deles...

 
Uladzimir Izerski #:

Por que todo mundo vai fundo quando tudo está na superfície, nos gráficos?

É claro que não existe uma constância perfeita de locais exatos para as reversões de preço. Nunca haverá. Mas a previsibilidade do comportamento dos preços não é perdida por causa disso. A precisão pode cair, mas não a previsibilidade. Há modelos inter-relacionados de mercados e não há como escapar deles...

Em geral, sou a favor da negociação manual... Você pode começar a jogar chinelos.

 
Rorschach #:

Em geral, sou a favor da negociação manual..... Você pode começar a jogar chinelos.

Já entendi. Eu já terminei. Já terminei. Vou pegar os chinelos).

 
Evgeni Gavrilovi #:

As informações mútuas são adequadas para isso?

https://scikit-learn.org/stable/modules/generated/sklearn.feature_selection.mutual_info_classif.html

Sim, também conhecido como correlação do século 21.

ou http://www.exploredata.net/
 
Maxim Dmitrievsky #:

Sim, é uma correlação do século 21

Ou http://www.exploredata.net/.

Qual é a melhor opção? Essa ou a do scikit-learn?

https://minepy.readthedocs.io/en/latest/python.html

 
Evgeni Gavrilovi #:

O que é melhor: este ou o do scikit-learn?

https://minepy.readthedocs.io/en/latest/python.html

Ambos são bons, o minepy é mais avançado, usei-o há muito tempo, não me lembro das diferenças.

Na verdade, não apoio a abordagem de selecionar entre um monte de recursos sem sentido por meio de informações mútuas, mas sim para uma avaliação rápida das normas de CT.

Eu tentaria até mesmo colocá-lo em um otimizador, como parte de um critério de otimização combinado para aqueles que correm por meio da genética.

Razão: