Discussão do artigo "Metamodelos em aprendizado de máquina e negociação: Tempo original das ordens de negociação" - página 14

[Excluído]  
Aleksey Vyazmikin #:

Referência

oh mai gash, quantos recursos existem... bem, você precisa de uma coluna de dataframe, uma coluna Klose e rótulos

tudo como no artigo, veja como o dataframe se parece lá. Caso contrário, você terá que reescrever o testador e todo o resto.

Nem sei quanto tempo é necessário para aprender algo assim.

 
Maxim Dmitrievsky #:

Meu Deus, são muitos sinais. Bem, precisamos de uma coluna de data e hora, uma coluna Klose e tags.

Como no artigo, dê uma olhada no dataframe. Caso contrário, você terá que reescrever o testador e todo o resto.

Nem sei quanto tempo é necessário para aprender algo assim.

Então, reescrevi o testador e tudo o mais....

Certo.

 
Maxim Dmitrievsky #:

Não sei quanto tempo leva para treinar em um desses.

Meu código é executado um pouco mais rápido do que o código original :) Portanto, o treinamento é ainda mais rápido. Mas estou usando GPU.

Por favor, esclareça se há algum erro no código.

    X = dataset[dataset['meta_labels']==1]
    X = dataset[dataset.columns[:-2]]

Essa expressão parece estar correta

    X = dataset[dataset['meta_labels']==1]
    #X = dataset[dataset.columns[:-2]]
    X = X[X.columns[:-2]]

Caso contrário, a primeira linha simplesmente não faz sentido, porque na segunda linha a condição de cópia de dados é executada novamente, o que leva à cópia sem filtragem pelo alvo "1" do metamodelo.

Estou apenas aprendendo e posso estar errado com esse python, por isso estou perguntando.....

[Excluído]  
Aleksey Vyazmikin #:

Meu código funciona um pouco mais rápido do que o código original :) Portanto, o treinamento é ainda mais rápido. Mas eu uso GPU.

Por favor, esclareça se isso é um bug no código

A expressão correta parece ser

Caso contrário, a primeira linha simplesmente não faz sentido, porque na segunda linha a condição de cópia de dados é executada novamente, o que leva à cópia sem filtragem pelo destino "1" do metamodelo.

Estou apenas aprendendo e posso estar errado com esse python, por isso estou perguntando.....

Sim, você percebeu corretamente, seu código está correto

Também tenho uma versão mais rápida e um pouco diferente, mas queria carregá-la como um artigo em MB.
 
Maxim Dmitrievsky #:

Sim, você percebeu corretamente, seu código está correto.

Também tenho uma versão mais rápida e um pouco diferente, mas queria carregá-la como um artigo em MB.

Escreva, será interessante.

O melhor que consegui com o treinamento.


E isso está em uma amostra separada


Adicionei o processo de inicialização por meio do treinamento.

Arquivos anexados:
[Excluído]  
Aleksey Vyazmikin #:

Escreva, será interessante.

A melhor coisa sobre o treinamento que consegui obter


E isso está em uma amostra separada


Acrescentei o processo de inicialização por meio do treinamento.

Bem, você já conhece Python.
Se ele mostrar isso, significa que é muito difícil encontrar um padrão. No seu caso, isso pode ser devido à alta dimensionalidade dos dados. Normalmente, coloco de 5 a 10 sinais.
 
Maxim Dmitrievsky #:
Pronto, você já conhece o python
.
Se ele mostrar isso, significa que é muito difícil encontrar um padrão. No seu caso, isso pode ser devido à alta dimensionalidade dos dados. Eu geralmente coloco de 5 a 10 recursos.

Eu não diria que sou um especialista - todos com um "dicionário".

Eu estava interessado em descobrir algum efeito dessa abordagem. Até agora, não percebi se há algum. Em geral, o CatBoost é treinado na amostra, sem nenhuma "mágica" - o equilíbrio está abaixo na imagem. Portanto, eu esperava um resultado mais expressivo.


[Excluído]  
Aleksey Vyazmikin #:

Eu não diria que sou versado - tudo com um "dicionário".

Eu estava interessado em encontrar algum efeito dessa abordagem. Até agora, não percebi se há algum. Portanto, o CatBoost é treinado na amostra, em geral, sem nenhuma "mágica" - o equilíbrio está abaixo na imagem. É por isso que eu esperava um resultado mais expressivo.

O efeito aparece após várias iterações, conforme mostrado no artigo. A cada iteração de treinamento, o resultado deve ser melhor.