Discussão do artigo "Reamostragem avançada e seleção de modelos CatBoost pelo método de força bruta" - página 7

 
Maxim Dmitrievsky

Nesse notebook, somente este bloco de código apresenta um erro


pr = get_prices(look_back=LOOK_BACK)

pr = add_labels(pr, 10, 25)

rep = testador(pr, MARKUP)

plt.plot(rep)

plt.show()


ValueError: Não é possível definir um quadro sem um índice definido e um valor que não pode ser convertido em uma série

Qual pode ser o motivo?

[Excluído]  
Evgeni Gavrilovi:

Nesse notebook, apenas este bloco de código apresenta um erro


pr = get_prices(look_back=LOOK_BACK)

pr = add_labels(pr, 10, 25)

rep = tester(pr, MARKUP)

plt.plot(rep)

plt.show()


ValueError: Não é possível definir um quadro sem um índice definido e um valor que não pode ser convertido em uma série

Qual pode ser o motivo?

O dataframe está vazio

verificar se as cotações foram recebidas ou não

[Excluído]  
elibrarius:
Tente você. Não vai demorar muito. Não seria interessante testá-lo em um experimento? Breiman não fez isso em sua floresta aleatória.

É lento. Vou tentar mais tarde.

 
Maxim Dmitrievsky:

está lento. Vou tentar mais tarde.

Será interessante ver o resultado. Acho que podemos dividir o teste pela metade, metade para o teste e metade para o exame. Ou acrescentar alguns anos.
 
Maxim Dmitrievsky:

dataframe vazio

verificar se as cotações foram recebidas ou não

é isso mesmo, não prestei atenção ao fato de que a corretora tem um "m" no final do par de eurobucks - EURUSDm.

[Excluído]  
elibrarius:
Será interessante ver o resultado. Acho que podemos dividir o teste pela metade, metade para o teste e metade para o exame. Ou acrescentar alguns anos.

Já fiz algo assim antes, um copo de madeira. Na verdade, não fez nada de bom.

Também duvido que isso aconteça neste caso. Mas vou verificar mais tarde.

 
Maxim Dmitrievsky:

Já fiz algo assim antes, um copo de madeira. De fato, não deu nada de maravilhoso.

Também duvido que isso aconteça neste caso. Mas vou verificar isso mais tarde.

Concordo que, na floresta, a média inicial é a melhor. Mas não custa nada verificar)

 
Valeriy Yastremskiy:

Concordo que, na floresta, a média inicial dos melhores resultados. Mas não custa nada checar)

Não, todas elas.

E ela é chamada de floresta aleatória porque todas as árvores aleatórias são somadas.
Pois a melhor não seria chamada de floresta aleatória, mas de melhor floresta. )))

 
elibrarius:

Não, todos eles.

E ela é chamada de floresta aleatória porque todas as árvores aleatórias se somam.
Pois a melhor seria chamada de melhor floresta, não de floresta aleatória. )))

Aparentemente, temos ideias diferentes sobre o reforço aleatório. Árvore decisiva, trata-se de recursos selecionados de um conjunto aleatório. A questão é que os conjuntos são aleatórios, mas a seleção/agrupamento em conjuntos bons e ruins estava originalmente lá. É como jogar uma agulha, medir os ângulos e calcular o número Pi)

do wiki.

  1. Vamos criar umaárvore de decisão que classifique as amostras de uma determinada subamostra e, durante a criação do próximo nó da árvore, escolheremos um conjunto de recursos com base nos quais o particionamento será realizado (não de todos osM recursos , mas apenas dem escolhidos aleatoriamente ). A seleção do melhor dessesm recursos pode ser feita de diferentes maneiras. O código Breiman original usa ocritério Gini, que também é usado no algoritmo de árvore decisivaCART. Em vez disso, algumas implementações do algoritmo usam ocritério de ganho de informações. [3]
[Excluído]  
Valeriy Yastremskiy:

Aparentemente, temos ideias diferentes sobre busting aleatório. Árvore decisiva, trata-se de recursos selecionados de um conjunto aleatório. A questão é que os conjuntos são aleatórios, mas a seleção/agrupamento em conjuntos bons e ruins estava originalmente lá. É como jogar uma agulha, medir os ângulos e calcular o número de pi)

do wiki

  1. Vamos criar umaárvore de decisão que classifique as amostras de uma determinada subamostra e, durante a criação do próximo nó da árvore, escolheremos um conjunto de recursos com base nos quais o particionamento será realizado (não de todos osM recursos , mas apenas dem escolhidos aleatoriamente ). A seleção do melhor dessesm recursos pode ser feita de diferentes maneiras. O código Breiman original usa ocritério Gini, que também é usado no algoritmo de árvore decisivaCART. Em vez disso, algumas implementações do algoritmo usam ocritério de ganho de informações. [3]

Sim, há muitas árvores, mas cada uma delas está tentando aprender melhor com recursos diferentes. Isso não é o mesmo que combinar várias florestas (inclusive as ruins)