Regressão Bayesiana - Alguém já fez um EA usando este algoritmo? - página 35

 

O que, não é suficiente novamente????

Bem, para mais:

Dependente: AUDNZD Múltiplo R = .83469441 F = 3845.556

R?= .69671476 df = 1.1674

Nº de casos: 1676 ajustado R?= .69653358 p = .000000

Erro padrão de estimativa: .053321255

Intercepção: 6,047516031 Std.Error: .0782142 t( 1674) = 77,320 p = 0,0000


 

Controle para a cabeça:

Dependente: NZDCAD Múltiplo R = .87619213 F = 5532.591

R?= .76771265 df = 1.1674

Nº de casos: 1676 ajustado R?= .76757389 p = .000000

Erro padrão de estimativa: .032035522

Intercepção: -2,664033151 Std.Error: .0469913 t( 1674) = -56,69 p = 0,0000


 
Дмитрий:

R^2 já é "muito baixo"?

Existe uma correlação?

A correlação é indetectável. R é fraco. Acontece que eu uso o R2 muito ativamente na avaliação da qualidade eqüitativa de minhas estratégias e, acredite, já vi centenas de gráficos onde o R2 era semelhante ao que é apresentado aqui. Este aqui é totalmente estanho, indistinguível da SB.

 
Vasiliy Sokolov:

A relação é indetectável. R é fraco. Acontece que eu mesmo sou muito ativo no uso do R2 para avaliar a qualidade da eqüidade de minhas estratégias, e acredite em mim, já vi centenas de gráficos cujo R2 foi mais ou menos o que é apresentado aqui. Este aqui é totalmente estanho, indistinguível da SB.

))))))))))))))))))))))))))0
 

Lembro-me de fazer o seguinte no projeto R: gerar mil trajetórias de mercado aleatórias, mil medidas cada uma. Então eu joguei uma regressão linear em cada um deles e recebi seu R^2. Como resultado, o vetor resultante dos valores R^2 acabou sendo um valor uniformemente distribuído de zero a 0,99... Com uma média de cerca de 0,5. Sugiro a todos que repitam meu resultado, e pensem na essência do que estamos contando.

s.w. Pena que eu não tenha R ou estes códigos em mãos, senão uma imagem valeria mil palavras...

 
Vasiliy Sokolov:
Lembro-me de fazer uma coisa dessas no projeto R: gerei mil trajetórias de mercado aleatórias, mil medidas cada uma. Então eu joguei uma regressão linear em cada um deles e recebi seu R^2. Como resultado, o vetor resultante dos valores R^2 acabou sendo um valor uniformemente distribuído de zero a 0,99... Com uma média de cerca de 0,5. Convido a todos a repetir meu resultado e pensar sobre a essência do que estamos contando.

И?

Qual é o objetivo do que está escrito? Essa análise de regressão não deve ser usada com base no argumento de que um do enésimo número da série PRNG gerada pode mostrar um grande R^2?

Portanto, é necessário deitar fora todos os métodos de previsão e previsão.

 
Vasiliy Sokolov:

Estou impressionado com o alto nível de domínio dos métodos matemáticos pelos painelistas e sua completa incompreensão dos princípios de sua aplicabilidade. Qualquer análise de regressão de dados correlacionados. Se não houver correlação, a regressão não é aplicável. Se a distribuição das quantidades em estudo for diferente da normal, os métodos estatísticos paramétricos também não são aplicáveis. O mercado não tem a propriedade da normalidade. Também o mercado como um processo não depende do tempo. Ambas riscam a própria idéia de análise de regressão, não importa o que esteja na raiz.

O problema é que muitos participantes, incluindo você, não entendem a regressão e utilizam definições obscuras. Não há limite para a distribuição de erros em uma definição adequada de análise de regressão. O principal é que os erros devem ser estatisticamente independentes um do outro para permitir que o erro de regressão total seja representado como a soma das funções dos erros individuais. Tudo o mais são casos especiais de regressão. Por exemplo, o requisito de normalidade de erro só se aplica à regressão RMS, ou seja, quando o erro de regressão total é representado como a soma dos quadrados dos erros individuais. Este é o método mais simples de regressão, portanto, leva à solução de um sistema de equações lineares. Se você não quiser assumir a normalidade dos erros, use qualquer outra distribuição. Ao invés da soma dos quadrados, o erro total será representado pela soma de alguma outra função de erros individuais.

Deixe-me tentar explicar desta forma. Suponha que tenhamos medidas y e dados de entrada x. Vamos traçar y em x. Os pontos de y(x) formam alguma nuvem. Se esta nuvem é circular com densidade uniforme de pontos em todas as direções, então não importa como torcer e parafusar com a distribuição de erros, o modelo y(x) não existe uma vez que y e x são independentes. Se esta nuvem se estende em alguma direção, então podemos construir um modelo. Nesse caso, temos várias opções de modelos:

1. Construir uma y_mod(x) linear = a + b*x ou uma y_mod(x) não linear = F(x) = exemplo = a0 + a1*x + a2*x^2 +... modelos.

2. Assumindo a independência dos erros de medição e[i] = y[i] - y_mod[i], assumimos sua normalidade err_sum = SUM e[i]^2, ou não-normalidade err_sum = SUM G(e[i]) onde G() é qualquer função "não quadrada", por exemplo G(e) = |e|, ou no caso geral G(e) = |e|^p. Podemos nos torcer e fazer uma função de erro onde é dado mais peso a valores negativos de y[i], por exemplo. O que escolhemos G(e) não afeta a previsibilidade de y em função de x. Só afeta a forma como traçamos uma linha reta através da nuvem y(x). Por exemplo, se G(e) = e^10, então esta linha reta estará mais próxima de valores maiores de y.

A escolha do linear y_mod(x) = a + b*x ou polinomial y_mod(x) = a0 + a1*x + a2*x^2 +... modelo depende da forma de nossa nuvem alongada. Em ambos os casos, podemos usar a regressão de média quadrada, o que levará a um sistema de equações lineares que é resolvido rapidamente.

Agora vamos falar de tempo. Se y(t) e x(t) dependem do tempo, o que acontece em quase todos os casos de regressão, uma vez que as medições são feitas em diferentes momentos, isso não altera a questão. Ainda podemos falar de regressão y(t) = F(x(t)). Se a função y(t) = F(x(t)) depende do tempo, ou seja, y(t) = F(x(t),t), então a regressão estática y=F(x) ao longo de todo o intervalo de tempo não é aplicável. Deve ser utilizado um modelo dinâmico y=F(x,t).

 
Vladimir:
De acordo com pesquisas feitas por um matemático (não me lembro de seu sobrenome, ele trabalha para FINAM), a distribuição é próxima do normal com caudas alongadas (mas é compreensível o porquê). Portanto, a regressão linear, imho, rege o dia.
 
Yuriy Asaulenko:
De acordo com pesquisas feitas por um matemático (não me lembro de seu sobrenome, ele trabalha para FINAM), a distribuição é próxima do normal com caudas alongadas (mas é compreensível o porquê). Portanto, a regressão linear, imho, é bastante boa.
Tentei muitas distribuições de erros diferentes. Não notei nenhuma diferença em particular nos resultados, mas o tempo de cálculo aumenta significativamente. É por isso que eu uso a regressão RMS. Tenho medo de chamá-lo linear, porque a função y(x) pode ser não linear em x variável, mas linear em coeficientes de modelo, em cujo caso, a regressão de quadrados médios ainda dá uma aceleração notável dos cálculos. Em vez de gastar tanto tempo com as teorias de aplicabilidade da normalidade e regressão, é muito mais importante falar sobre a preparação dos dados de entrada, pois posso desenhar esta nuvem y(x) ou torná-la circular por uma simples transformação de entrada x e medidas y. Como traçar uma linha reta ou uma parábola através desta nuvem e calcular os erros de modelagem (quadrados ou valores absolutos) é uma questão secundária.
 

Apelo para os céticos.

Senhoras e senhores, senhoras e senhores, camaradas! Há muito sangue em seu sistema de circulação de álcool.(C)

O que você pode modelar matematicamente em R se ainda não decidiu sobre as questões conceituais para a fórmula Bayes: qual é o mercado à direita da barra zero. E é um mercado? Ou talvez um bom simulador de jogo com um algoritmo apropriado? Qual a função de distribuição e probabilidade a ser tomada?

O mundo não chegou a um final feliz com a distribuição normal. Bayes estava morto quando Gauss nasceu. Sugeri tomar a distribuição normal porque vocês, céticos, a mostraram de forma convincente. E se vocês céticos dizem que não se encaixa, não se aplica, então, por favor, proponham algo que se encaixe, além do que já está proposto. Sua função de probabilidade e lei de distribuição pode ser aplicada à fórmula Bayes, por exemplo, como descrevi na p.31 no post de 8 de março sob o buquê. E veja o que acontece.