Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 3012

 
Maxim Dmitrievsky #:

o que você está dizendo ainda ninguém entende, na minha opinião)

Ele esclareceu tudo sem palavras e de forma simples, de acordo com o princípio da navalha de Occam.

Não, é que quando eu entrei no tópico e comecei a falar sobre a extração de regras das árvores e sua avaliação, você riu da ideia.

Agora dei o próximo passo - a criação de condições para a criação de regras potencialmente de alta qualidade por meio da avaliação de segmentos quânticos do preditor, e novamente me deparo com um total mal-entendido.

 
СанСаныч Фоменко #:

Já escrevi algumas vezes.

Aqui você tem que dizer a mesma coisa cem vezes para ser ouvido.

 
Aleksey Vyazmikin #:

Não, é que quando eu entrei no tópico e comecei a falar sobre a retirada de regras das árvores e a avaliação delas, você riu da ideia.

Agora, dei o próximo passo - a criação de condições para a criação de regras potencialmente de alta qualidade por meio da estimativa de seções quânticas do preditor - e novamente me deparei com um mal-entendido total.

Então, simplesmente extrair regras da árvore não o deixa feliz? Em teoria, também é uma questão de sorte, mas às custas de seu número (de regras), é possível encontrar algo.

É quase o mesmo que pesquisar parâmetros de estratégia em um otimizador, mas de uma forma mais elegante.
 
Maxim Dmitrievsky #:

Então, simplesmente tirar as regras da árvore não o deixou feliz?

O método acabou sendo muito bom, exceto pelo fato de que não há certeza sobre a vida futura das regras com sua reencarnação subsequente. Em intervalos longos, mais de 50% das regras selecionadas apresentaram resultados de desempenho positivos.

Usei uma árvore genética, o que é muito lento se a amostra contiver muitos preditores.

Por isso, decidi procurar maneiras de reduzir a quantidade de informações fornecidas à árvore para treinamento. Comecei a procurar maneiras de destacar dados potencialmente úteis.

Outro problema é que as folhas/regras são muito semelhantes em termos de pontos de ativação. E, à medida que a base de folhas crescia, era difícil encontrar exclusividade.

Como resultado, o design é interessante, há algo a melhorar, mas foi extremamente lento no meu caso. Em geral, não é adequado para experimentos, mas é interessante para implementação, se todo o conceito do dispositivo de construção de TC estiver pronto.

E, é claro, eu não conheço o R, perguntei aos gurus locais e ninguém pôde me ajudar a resolver minhas tarefas.

Agora eu acrescentaria a amostragem e a seleção forçada do preditor raiz (por lista) e o bloqueio do preditor já usado.

 
Aleksey Vyazmikin #:

O método acabou sendo muito bom, exceto pelo fato de que não há certeza sobre a vida útil das regras com sua reencarnação subsequente. Em intervalos longos, mais de 50% das regras selecionadas apresentaram resultados de desempenho positivos.

Usei uma árvore genética, que é muito lenta se a amostra contiver muitos preditores.

Por isso, decidi procurar maneiras de reduzir o volume de informações fornecidas à árvore para treinamento. Comecei a procurar maneiras de selecionar dados potencialmente úteis.

Outro problema é que as folhas/regras são muito semelhantes em termos de pontos de ativação. E, à medida que a base de folhas crescia, era difícil encontrar exclusividade.

Como resultado, o design é interessante, há algo a melhorar, mas foi extremamente lento no meu caso. Em geral, não é adequado para experimentos, mas é interessante para implementação, se todo o conceito do dispositivo de construção do TC estiver pronto.

E, é claro, eu não conheço o R, perguntei aos gurus locais e ninguém pôde me ajudar a resolver meus problemas.

Agora eu acrescentaria a amostragem e a seleção forçada do preditor raiz (por lista) e o bloqueio do preditor já usado.

O que o catbust tem a ver com isso? Por que você precisa dele, você também extrai regras dele?

Por que não pegar uma árvore simples e ir da raiz até o topo por meio de regras, dando menos peso às regras complexas (penalidade pela complexidade da regra)?

executar cada regra em um testador com novos dados, descartando previamente aquelas com um grande erro.

ZY, ainda não gosto dessa abordagem intuitivamente, mas ainda não descobri o motivo
 
Aleksey Vyazmikin #:

E, é claro, eu não conheço o R,

Estou ouvindo isso há mais de um ano.

Você pode aprender R em uma semana.

 
Maxim Dmitrievsky #:

O que o catbust tem a ver com isso? Por que você precisa dele, você também obtém as regras com ele?

O CatBoost é uma ótima velocidade para verificar se a direção das ideias está correta em primeiro lugar.

Posso extrair regras da primeira árvore, mas é claro que, em média, elas são muito mais fracas (há regras boas, mas muito raramente), então deixei essa ideia de lado por enquanto. Agora há uma maneira alternativa de construir árvores, talvez as regras sejam mais fortes lá, mas não há possibilidade de trabalhar em MQL5 com esse modelo sem python.

E, em geral, tenho minhas próprias ideias de como construir um modelo que seja lento para criar, mas com as mesmas verificações que foram usadas para selecionar as folhas. Talvez um dia eu consiga implementá-lo em código.

 
Maxim Dmitrievsky #:

Por que não usar uma árvore simples e ir da raiz aos topos por regra, dando menos peso às regras complexas (penalidade pela complexidade da regra)?

executar cada regra em um testador com novos dados, descartando previamente aquelas com um grande erro.

ZY, ainda não gosto dessa abordagem intuitivamente, mas ainda não descobri o motivo

A diferença está basicamente apenas na quantidade de dados e na carga da CPU ao aplicar o modelo.

Além disso, é mais fácil agrupar as folhas agrupando e distribuindo os pesos (eu o chamei de herbário :)).

Muitas árvores são usadas para criar regras, o que significa que os sinais se sobrepõem, o que não é o caso em apenas uma árvore.

 
mytarmailS #:

Estou ouvindo isso há mais de um ano.

R pode ser aprendido em uma semana

Aparentemente, nem todo mundo é tão talentoso.

E o código não é simples - tentei refazê-lo, mas não havia informações suficientes na Internet para resolver o problema.

Outra desvantagem do R é que não há uma solução simples para paralelizar cálculos entre computadores.

 
Aleksey Vyazmikin #:

A diferença está basicamente apenas na quantidade de dados e na carga da CPU ao aplicar o modelo.

Além disso, as folhas são mais fáceis de agrupar, reunindo-as em grupos e distribuindo pesos (chamei isso de herbário :)).

Muitas árvores são usadas para criar regras, o que significa que os sinais se sobrepõem, o que não acontece em apenas uma árvore.

Percebo por que não gosto dessa ideia, porque associação (regras, por exemplo)! = causalidade :)

Razão: