Discussão do artigo "Gradient Boosting (CatBoost) no desenvolvimento de sistemas de negociação. Uma abordagem ingênua" - página 7

 
Essa abordagem está completamente errada. Não é possível gerar um modelo com base no mesmo conjunto de dados de treinamento e teste e depois dizer que ele está funcionando, pois isso é inútil e sem fundamento. Isso é chamado de ajuste de curva do modelo. Esses modelos parecem bons no papel, mas nunca funcionarão no mundo real. Use a abordagem correta para o aprendizado de máquina. Há várias maneiras de fazer isso, mas a sua está completamente errada.
[Excluído]  
Jacob James:
Essa abordagem está completamente errada. Não é possível gerar um modelo com base no mesmo conjunto de dados de treinamento e teste e depois dizer que ele está funcionando, pois isso é inútil e sem fundamento. Isso é chamado de ajuste de curva do modelo. Esses modelos parecem bons no papel, mas nunca funcionarão no mundo real. Use a abordagem correta para o aprendizado de máquina. Há várias maneiras de fazer isso, mas a sua está completamente errada.

Acho que vocês dois estão completamente errados. O artigo marcado como "abordagem ingênua" é uma introdução ao modelo CatBoost. Ninguém o proíbe de testar o modelo com novos dados. Além disso, no final do artigo, você pode ver o teste em novos dados + período de aprendizado.

Basta ler os artigos com mais atenção, pois a próxima parte está a caminho.
 
Maxim Dmitrievsky:

Devo ter queimado meus olhos enquanto descobria o que você está fazendo aqui, embora tudo seja simples ao ponto da impossibilidade, mas ainda é difícil perceber os pensamentos de outra pessoa....

O que posso dizer?

1) os sinais definitivamente não são os melhores, há um escopo enorme.

2) não é necessário misturar os dados antes de treinar o classificador (eu verifiquei isso).

3) O que é realmente valioso é o alvo, é ele que puxa todo o artigo (eu o comparei com o ZZ, o ZZ é um lixo).


Em geral, a abordagem acabou sendo a seguinte - maximizar todos os "movimentos apenas para obter um bom resultado na validação"

E selecionamos o melhor modelo ))))

E eu consegui "mover" dessa forma.

Mas, na verdade, é a mesma maneira que eu estava falando quando otimizei os pesos dos neurônios, só que eu "me movi" imediatamente com o lucro máximo.

Bem, não sei mais o que escrever...

[Excluído]  
mytarmailS:

Devo ter queimado os olhos enquanto descobria o que você estava fazendo aqui, embora tudo seja simples ao ponto de ser impossível, mas ainda é difícil perceber os pensamentos de outra pessoa....

O que posso dizer?

1) os sinais não são os melhores, há um espaço enorme.

2) não é necessário embaralhar os dados antes de treinar o classificador (eu verifiquei isso).

3) O que é realmente valioso é o alvo, é o que puxa o artigo inteiro (comparado com o ZZ, o ZZ é um lixo)


Em geral, a abordagem acabou sendo a seguinte: "movemos tudo o máximo possível apenas para obter um bom resultado na validação".

E selecionamos o melhor modelo ))))

E eu consegui "mover" dessa forma.

Mas, na verdade, é a mesma maneira que eu estava falando quando otimizei os pesos do neuronkey, só que eu o estava movendo para o lucro máximo.

Bem, não sei mais o que escrever...

Isso não funciona dessa forma sem o GMM. Além disso, você não se deu conta do intervalo curto em que pode treinar e do tempo de vida do modelo com novos dados. Esse não é o limite, há maneiras de estender a vida útil. A abordagem como um todo é orgânica, não é possível separar as partes.

Sim, você pode tentar outras mais significativas. Use-a, aprimore-a

 
Maxim Dmitrievsky:

Isso não funciona dessa forma sem o GMM. Além disso, você não verificou o intervalo curto em que pode treinar e quanto tempo o modelo dura com novos dados. Esse não é o limite, há maneiras de estender a vida útil. A abordagem completa é orgânica, não é possível separar as partes.

Sim, você pode tentar outras mais significativas. Use-a, aprimore-a

Vou tentar isso com o gmm amanhã.

[Excluído]  
mytarmailS:

Vou tentar fazer isso com o gmm amanhã.

Ah, esse é o artigo que você escreveu. Então, sim. É um artigo introdutório, para não confundir completamente o leitor.
 
Maxim Dmitrievsky:
Ah, esse é o artigo sobre o qual você escreveu. Sim, é. É um artigo introdutório para evitar que o leitor saia completamente dos trilhos.

Sim, pensei em analisá-lo em ordem

 
Em geral, sem o Shuffle, o sistema começa imediatamente a drenar de forma esperada.
[Excluído]  
Александр:
Em geral, sem o Shuffle, o sistema começa imediatamente a se esgotar de forma esperada.

Agora você pode pular para o próximo artigo

 
Eu o usei,ou eu mesmo o fiz ou usei o que você forneceu. os seguintes erros.