Regressão Bayesiana - Alguém já fez um EA usando este algoritmo? - página 35
Você está perdendo oportunidades de negociação:
- Aplicativos de negociação gratuitos
- 8 000+ sinais para cópia
- Notícias econômicas para análise dos mercados financeiros
Registro
Login
Você concorda com a política do site e com os termos de uso
Se você não tem uma conta, por favor registre-se
O que, não é suficiente novamente????
Bem, para mais:
Dependente: AUDNZD Múltiplo R = .83469441 F = 3845.556
R?= .69671476 df = 1.1674
Nº de casos: 1676 ajustado R?= .69653358 p = .000000
Erro padrão de estimativa: .053321255
Intercepção: 6,047516031 Std.Error: .0782142 t( 1674) = 77,320 p = 0,0000
Controle para a cabeça:
Dependente: NZDCAD Múltiplo R = .87619213 F = 5532.591
R?= .76771265 df = 1.1674
Nº de casos: 1676 ajustado R?= .76757389 p = .000000
Erro padrão de estimativa: .032035522
Intercepção: -2,664033151 Std.Error: .0469913 t( 1674) = -56,69 p = 0,0000
R^2 já é "muito baixo"?
Existe uma correlação?
A correlação é indetectável. R é fraco. Acontece que eu uso o R2 muito ativamente na avaliação da qualidade eqüitativa de minhas estratégias e, acredite, já vi centenas de gráficos onde o R2 era semelhante ao que é apresentado aqui. Este aqui é totalmente estanho, indistinguível da SB.
A relação é indetectável. R é fraco. Acontece que eu mesmo sou muito ativo no uso do R2 para avaliar a qualidade da eqüidade de minhas estratégias, e acredite em mim, já vi centenas de gráficos cujo R2 foi mais ou menos o que é apresentado aqui. Este aqui é totalmente estanho, indistinguível da SB.
Lembro-me de fazer o seguinte no projeto R: gerar mil trajetórias de mercado aleatórias, mil medidas cada uma. Então eu joguei uma regressão linear em cada um deles e recebi seu R^2. Como resultado, o vetor resultante dos valores R^2 acabou sendo um valor uniformemente distribuído de zero a 0,99... Com uma média de cerca de 0,5. Sugiro a todos que repitam meu resultado, e pensem na essência do que estamos contando.
s.w. Pena que eu não tenha R ou estes códigos em mãos, senão uma imagem valeria mil palavras...
Lembro-me de fazer uma coisa dessas no projeto R: gerei mil trajetórias de mercado aleatórias, mil medidas cada uma. Então eu joguei uma regressão linear em cada um deles e recebi seu R^2. Como resultado, o vetor resultante dos valores R^2 acabou sendo um valor uniformemente distribuído de zero a 0,99... Com uma média de cerca de 0,5. Convido a todos a repetir meu resultado e pensar sobre a essência do que estamos contando.
И?
Qual é o objetivo do que está escrito? Essa análise de regressão não deve ser usada com base no argumento de que um do enésimo número da série PRNG gerada pode mostrar um grande R^2?
Portanto, é necessário deitar fora todos os métodos de previsão e previsão.
Estou impressionado com o alto nível de domínio dos métodos matemáticos pelos painelistas e sua completa incompreensão dos princípios de sua aplicabilidade. Qualquer análise de regressão de dados correlacionados. Se não houver correlação, a regressão não é aplicável. Se a distribuição das quantidades em estudo for diferente da normal, os métodos estatísticos paramétricos também não são aplicáveis. O mercado não tem a propriedade da normalidade. Também o mercado como um processo não depende do tempo. Ambas riscam a própria idéia de análise de regressão, não importa o que esteja na raiz.
O problema é que muitos participantes, incluindo você, não entendem a regressão e utilizam definições obscuras. Não há limite para a distribuição de erros em uma definição adequada de análise de regressão. O principal é que os erros devem ser estatisticamente independentes um do outro para permitir que o erro de regressão total seja representado como a soma das funções dos erros individuais. Tudo o mais são casos especiais de regressão. Por exemplo, o requisito de normalidade de erro só se aplica à regressão RMS, ou seja, quando o erro de regressão total é representado como a soma dos quadrados dos erros individuais. Este é o método mais simples de regressão, portanto, leva à solução de um sistema de equações lineares. Se você não quiser assumir a normalidade dos erros, use qualquer outra distribuição. Ao invés da soma dos quadrados, o erro total será representado pela soma de alguma outra função de erros individuais.
Deixe-me tentar explicar desta forma. Suponha que tenhamos medidas y e dados de entrada x. Vamos traçar y em x. Os pontos de y(x) formam alguma nuvem. Se esta nuvem é circular com densidade uniforme de pontos em todas as direções, então não importa como torcer e parafusar com a distribuição de erros, o modelo y(x) não existe uma vez que y e x são independentes. Se esta nuvem se estende em alguma direção, então podemos construir um modelo. Nesse caso, temos várias opções de modelos:
1. Construir uma y_mod(x) linear = a + b*x ou uma y_mod(x) não linear = F(x) = exemplo = a0 + a1*x + a2*x^2 +... modelos.
2. Assumindo a independência dos erros de medição e[i] = y[i] - y_mod[i], assumimos sua normalidade err_sum = SUM e[i]^2, ou não-normalidade err_sum = SUM G(e[i]) onde G() é qualquer função "não quadrada", por exemplo G(e) = |e|, ou no caso geral G(e) = |e|^p. Podemos nos torcer e fazer uma função de erro onde é dado mais peso a valores negativos de y[i], por exemplo. O que escolhemos G(e) não afeta a previsibilidade de y em função de x. Só afeta a forma como traçamos uma linha reta através da nuvem y(x). Por exemplo, se G(e) = e^10, então esta linha reta estará mais próxima de valores maiores de y.
A escolha do linear y_mod(x) = a + b*x ou polinomial y_mod(x) = a0 + a1*x + a2*x^2 +... modelo depende da forma de nossa nuvem alongada. Em ambos os casos, podemos usar a regressão de média quadrada, o que levará a um sistema de equações lineares que é resolvido rapidamente.
Agora vamos falar de tempo. Se y(t) e x(t) dependem do tempo, o que acontece em quase todos os casos de regressão, uma vez que as medições são feitas em diferentes momentos, isso não altera a questão. Ainda podemos falar de regressão y(t) = F(x(t)). Se a função y(t) = F(x(t)) depende do tempo, ou seja, y(t) = F(x(t),t), então a regressão estática y=F(x) ao longo de todo o intervalo de tempo não é aplicável. Deve ser utilizado um modelo dinâmico y=F(x,t).
De acordo com pesquisas feitas por um matemático (não me lembro de seu sobrenome, ele trabalha para FINAM), a distribuição é próxima do normal com caudas alongadas (mas é compreensível o porquê). Portanto, a regressão linear, imho, é bastante boa.
Apelo para os céticos.
Senhoras e senhores, senhoras e senhores, camaradas! Há muito sangue em seu sistema de circulação de álcool.(C)
O que você pode modelar matematicamente em R se ainda não decidiu sobre as questões conceituais para a fórmula Bayes: qual é o mercado à direita da barra zero. E é um mercado? Ou talvez um bom simulador de jogo com um algoritmo apropriado? Qual a função de distribuição e probabilidade a ser tomada?
O mundo não chegou a um final feliz com a distribuição normal. Bayes estava morto quando Gauss nasceu. Sugeri tomar a distribuição normal porque vocês, céticos, a mostraram de forma convincente. E se vocês céticos dizem que não se encaixa, não se aplica, então, por favor, proponham algo que se encaixe, além do que já está proposto. Sua função de probabilidade e lei de distribuição pode ser aplicada à fórmula Bayes, por exemplo, como descrevi na p.31 no post de 8 de março sob o buquê. E veja o que acontece.