Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 496

 
Dr. Trader:

A floresta pode extrapolar? Sim.
Faz isso bem? Não.


O que é bom e o que é mau?

Você tem uma análise comparativa de diferentes modelos? E desde o início: com a adequação de determinados preditores para um determinado alvo, com a adequação de um determinado conjunto de preditores para um determinado modelo, e depois avaliação com uma execução obrigatória num ficheiro fora dos ficheiros de formação? Com a justificação de que os modelos não são excessivamente treinados.


Com tudo isso no lugar será possível julgar o que é bom e o que é ruim para um conjunto particular de preditores e alvos. Ao mesmo tempo, deve-se entender que muito provavelmente existe um conjunto diferente de preditores e metas que darão um resultado diferente.


Para o meu caso em particular, fiz tal trabalho. Eu publiquei o resultado várias vezes neste tópico. Ordem dos modelos, em ordem decrescente: ada, rf, SVM. O pior é NS, mas é uma versão antiga, eu não usei as modernas. Tudo isto está sujeito às condições acima.

 
Dr. Trader:

Aqui está um exemplo interessante, eu postei neste tópico há algum tempo atrás.
Neste caso, a extrapolação seria prever fora da "nuvem de pontos conhecidos".

Se os pontos conhecidos estiverem bem agrupados, podemos ver que a extrapolação não é um problema para a maioria dos modelos.
Mas se os pontos conhecidos fossem dispostos de forma mais aleatória, sem aglomerados óbvios, então a previsão em si seria pior e a extrapolação não seria credível.

É tudo uma questão de preditores, se você colocar lixo no modelo você realmente não pode extrapolar bem.
E eu nunca negociaria com dados financeiros usando extrapolação.


extrapolação é uma previsão em pontos desconhecidos, se os pontos estiverem fora do máximo e mínimo da amostra de treinamento, então a RF sempre sairá do máximo e mínimo da amostra treinada

Estás apenas confuso com a aproximação da TB?

 
Dr. Trader:

Aqui está um exemplo interessante, eu postei neste tópico há algum tempo atrás.
Extrapolação seria prever fora da "nuvem de pontos conhecidos".

Se os pontos conhecidos estão bem agrupados, então podemos ver que a extrapolação não é um problema para a maioria dos modelos.
Mas se os pontos conhecidos fossem dispostos de forma mais aleatória, sem aglomerados óbvios, então a previsão em si seria pior e a extrapolação não seria credível.

É tudo uma questão de preditores, se você colocar lixo no modelo você realmente não pode extrapolar bem.
E eu nunca negociaria com dados financeiros usando extrapolação.


A questão da confiança nas estatísticas em geral é filosófica.

Aqui está a classificação.

Será que a própria noção de extrapolação se aplica a ela? Não na minha cabeça. A classificação encontra padrões, e depois tenta distribuir novos dados de acordo com esses padrões.


Extrapolação em modelos analíticos que têm alguma função na forma analítica.


E ARIMA? Há uma extrapolação nela? Depende do quê. O modelo em si leva as últimas barras, normalmente uma de cada vez. Mas a seleção de parâmetros requer milhares de barras. Este mil é extrapolado e o que estava no último cálculo não é.


Eu não acho que a extrapolação no seu sentido matemático seja aplicável aos mercados financeiros.

 
SanSanych Fomenko:

A questão da confiança nas estatísticas em geral é filosófica.

Aqui está uma classificação.

Será que a própria noção de extrapolação se lhe aplica? Não na minha cabeça. A classificação encontra padrões, e depois tenta distribuir novos dados de acordo com esses padrões.


Extrapolação em modelos analíticos que têm alguma função na forma analítica.


E ARIMA? Há uma extrapolação nela? Depende do quê. O modelo em si leva as últimas barras, geralmente uma de cada vez. Mas a seleção de parâmetros requer milhares de barras. Este mil é extrapolado e o que estava no último cálculo não é.


Eu não acho que a extrapolação no seu sentido matemático seja aplicável aos mercados financeiros.


Extrapolação em MO é a capacidade de um modelo de trabalhar com novos dados, e é um tipo especial de aproximação. Em uma amostra de treinamento seu modelo APPROXIMES, em novos dados não na amostra de treinamento ele EXTRAPOLISAS.

é por isso que eu dei um exemplo com regressão linear em comparação com XGboost, que você não leu cuidadosamente, a regressão linear extrapola perfeitamente, enquanto qualquer coisa envolvendo árvores de decisão NÃO PODE extrapolar devido à estrutura das árvores de decisão

 

Aregressão linear em geral existe e, em particular, só extrapola em séries estacionárias com resíduos normalmente distribuídos a partir do modelo. Há um grande número de limitações à sua aplicação que tornam este tipo de modelo inútil para as séries financeiras.

Ou se entra na APLICABILIDADE dos modelos aos seus dados específicos, então é modelagem, em todos os outros casos é um jogo de números.

Um grande número de posts neste tópico são jogos de números, já que nenhuma prova é dada para provar o contrário.

 
SanSanych Fomenko:

Aregressão linear em geral existe e, em particular, só extrapola em séries estacionárias com resíduos normalmente distribuídos a partir do modelo. Há um grande número de limitações à sua aplicação que tornam este tipo de modelo inútil para as séries financeiras.

Ou se entra na APLICABILIDADE dos modelos aos seus dados específicos, então é modelagem, em todos os outros casos é um jogo de números.

Um grande número de mensagens neste tópico é um jogo de números, pois não são dadas provas para provar o contrário.


o que a regressão linear tem a ver com isso? a questão era como usar corretamente os andaimes para evitar cometer erros estúpidos, como pensar que eles podem EXTRAPOLISHER.

Você alimenta as florestas com uma série temporal sob a forma de citações, e o modelo irá prever apenas o valor máximo e mínimo da série estudada, se ela for além do intervalo

 
Aliosha:

Que confusão, cavalheiros...

um pouco de informação da KO:


Nos mercados financeiros, a extrapolação/interpolação é aplicável e muito solicitada.


Se é "aplicável e em demanda", então por que você não fez um TS de sucesso em todos esses anos?

P.S. Ouço um gato a ladrar... Certo, eu acho que Aliosha escreveu algo novamente!

 
Aliosha:

Que confusão, cavalheiros...

um pouco de informação da KO:

Extrapolação e interpolação no contexto do MO são a mesma coisa! Em ambos os casos você precisa obtero valor(int,float[]) de um ponto que NÃO é o mesmo que o ponto no conjunto de dados de treinamento. As reservas sobre a localização do ponto no hiperespaço, em relação à nuvem de pontos de treino, é IMPOSSÍVEL, pois tudo depende das características, a estrutura do espaço de características, numa projecção será um ponto "fora" da nuvem de treino, noutra "dentro" não é importante, só faz sentido O QUE NÃO ESTÁ EM TREINAMENTO, ponto.

Para resumir: Se o ponto não estiver no conjunto de dados do treinamento, o resultado da sua classificação ou regressão, será tanto a extrapolação como a interpolação, dependendo da interpretação final do resultado pela área temática, mas para o algoritmo MO, ELESÃO UM E UM.

A floresta extrapola - ótimo! Nas mãos certas, melhor e ordens de magnitude mais rápidas que a NS.

Nos mercados financeiros, a extrapolação/interpolação é aplicável e muito solicitada.


Um conselho separado para Maxim: uma pessoa inteligente é mais frequentemente enganada do que um tolo, porque faz muito mais testes, mas só o tolo está emocionalmente ligado ao seu ponto de vista e é difícil para ele separar-se dele. Você escolhe quem você é)))


ok, dê-me um exemplo de pelo menos 1 artigo com um exemplo que mostre o quão bem os andaimes extrapolam. Não consegui encontrar nenhum.

que, na minha opinião, não é grande coisa.

e como você vai saber quando o ponto está dentro e quando está fora da nuvem, quando você tem um monte de características diferentes, e como isso é importante quando o intervalo de valores alvo em treinamento, quando todas as árvores são construídas, então o alvo NUNCA pode sair desse intervalo


 
Maxim Dmitrievsky:

a regressão linear é excelente na extrapolação, enquanto qualquer coisa com árvores de decisão NÃO PODE extrapolar

A extrapolação envolve a previsão de novos dados além dos valores preditores conhecidos durante o treinamento.

Aqui está um pedaço de uma imagem antiga, todo verde sombreado é extrapolação, e a imagem mostra que a floresta pode fazer isso, caso contrário seria branca (como no caso de alguns modelos SVM)


Tanto a floresta, como a rede neural e o modelo linear podem extrapolar. Se você quiser prever valores longe dos conhecidos, todos estes modelos darão uma previsão e todos eles têm algum tipo de algoritmo para tais casos.

Mas por que você acha que se um modelo linear extrapolar usando a fórmula y=ax+b ele o fará perfeitamente, mas se a floresta o fizer usando o vizinho conhecido mais próximo é inútil? Estes dois algoritmos têm o direito de existir. Como disse SanSanych - para cada conjunto de preditores e objetivos para realizar pesquisas e comparar os modelos, só então você pode dizer se o modelo faz uma extrapolação perfeita.
O que está escrito nos artigos sobre o hubra - também se aplica a preditores e alvos específicos, não é a verdade que funciona para todos os casos, é um estudo específico para um caso em particular.

 
Dr. Trader:

Extrapolação implica prever novos dados além dos valores preditores conhecidos durante o treinamento.

Aqui está um pedaço de uma imagem antiga, tudo sombreado de verde é extrapolação, e a julgar pela imagem a floresta pode fazê-lo, caso contrário tudo seria colorido de branco (como no caso de alguns modelos SVM)


Tanto a floresta, como a rede neural e o modelo linear podem extrapolar. Se você der dados longe dos valores conhecidos para uma previsão, todos esses modelos darão uma previsão, todos eles têm alguns algoritmos para esses casos.

Mas por que você acha que se um modelo linear extrapolar usando a fórmula y=ax+b, então ele o faz perfeitamente, mas se a floresta o faz usando o vizinho conhecido mais próximo, então ele não pode fazer nada? Estes dois algoritmos têm o direito de existir. Como disse SanSanych - para cada conjunto de preditores e metas para pesquisar e comparar os modelos, só então você pode dizer se o modelo faz uma extrapolação perfeita.
O que está escrito em artigos sobre hubra - também se aplica a preditores e alvos específicos, não é uma verdade que funciona para todos os casos, é um estudo de caso específico.


Só tens de fazer um estudo em árvore.


Razão: