Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 1038

 
Roffild:
O que isso tem a ver com o "limiar" de uma floresta aleatória?

Não me lembro qual é o limiar, deve ser o seu limiar para entrar numa troca ou algo como 0,75 ou o que quer que seja (tipo de probabilidade)

 
Roffild:
O que o "limiar" tem a ver com a floresta aleatória?

No caso da regressão de logit, posso imaginar quais são as probabilidades de atribuição de classes, no caso da floresta, infelizmente. Portanto, estas são pseudo-probabilidades muito provavelmente, e não deve funcionar dessa forma. Com um limiar de 0,75 não deve significar que a probabilidade de atribuição a uma classe seja maior do que com 0,6, por exemplo.

pelo menos não li nenhuma informação sobre isso.
 

E aceito a "probabilidade" como parte importante do algoritmo da floresta aleatória, porque a fórmula para calcular o resultado de todas as árvores é baseada nela.

Eu até defino o número de árvores com esta "probabilidade" em mente.

 
Roffild:

E eu aceito a "probabilidade" como uma parte importante do algoritmo da floresta aleatória, porque a fórmula para contar o resultado de todas as árvores é construída a partir disso.

Eu até defino o número de árvores com esta "probabilidade" em mente.

Você leva em conta quantas folhas ocupam o lote de amostra? O tamanho do comitê realmente votando sobre a situação, dada a alta probabilidade de competência de cada folha de tal árvore?

 
Aleksey Vyazmikin:

Você leva em conta quantas folhas ocupam a área de amostra? O tamanho do comitê realmente votando sobre a situação dada a alta probabilidade de competência de cada folha de tal árvore?

O ramo final é responsável por pelo menos 25 variantes da amostra treinada. Está definido em parâmetros de Centelha. Não existe tal parâmetro em AlgLib.
 
Roffild:
O ramo final é responsável por pelo menos 25 variantes da amostra treinada. Está definido nos parâmetros Spark. Não existe tal parâmetro em AlgLib.

Talvez eu não tenha colocado dessa forma.

Supondo que temos 100 árvores, cada folha de cada vez (no caso simples de 2 escolhas) faz uma classificação, então levamos em conta que a votação pode envolver árvores com uma margem de erro muito grande - por exemplo, 49/51, o que distorceria significativamente a previsão média. Talvez nos devêssemos livrar de tais folhas da votação por completo? Porque a falta de capacidade de previsão diz mais sobre um modelo de folha de árvore pobre quando se lida com dados específicos.

 
Novo ranking de linguagens de programação incluindo Python e R
 
SanSanych Fomenko:
Novo ranking de linguagens de programação incluindo python e R
Bom material. Mas as suas próprias conclusões sobre R e Python são rebuscadas. Eles não podem ser comparados pelos seus critérios - é como quente e suave.
 
Yuriy Asaulenko:
Bom material. Mas as suas próprias conclusões sobre R e Python são rebuscadas. Você não pode compará-los de forma alguma pelos seus critérios - é como quente e suave.

E mais especificamente?

Estou a comparar o aparelho de referência das línguas.

Como você quer?

 
SanSanych Fomenko:

E mais especificamente?

Estou a comparar o aparelho de referência das línguas.

Como você quer?

Quantitativamente, existem mais veículos motorizados do que tratores, mas é um absurdo compará-los entre si.
Em termos de ajuda, ambos são extensos. Em termos de módulos, eles se sobrepõem parcialmente.
Python tem um porto em R, acho eu, e R para Python.
Se você tem uma tarefa complexa, você tem que portar algo de fora se você trabalha em qualquer ambiente e em qualquer idioma. Gostando ou não, você deve ter um caminhão, um trator e uma escavadeira além disso.
Razão: