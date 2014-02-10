Teorias sem fatos podem ser improdutivas, mas fatos sem teorias não tem sentido.

K. Boulding

Introdução

Muitas vezes eu ouço que os mercados são voláteis e não há estabilidade. E isso explica por que um sucesso comercial a longo prazo é impossível. Mas é verdade? Vamos tentar analisar esse problema cientificamente. E vamos escolher os meios econométricos de análise. Por que eles? Primeiro de tudo, a comunidade MQL ama precisão, a qual vai ser fornecida por matemática e estatística. Em segundo lugar, isso não foi descrito antes, se não estou enganado.



Deixe-me mencionar que o problema do sucesso comercial a longo prazo não pode ser resolvido dentro de um único artigo. Hoje, eu vou descrever apenas alguns métodos de diagnóstico para o modelo selecionado, que espero mostrar-se muito útil para uso futuro.



Além de que, eu vou tentar o meu melhor para descrever de forma clara algum material dessecado, incluindo fórmulas, teoremas e hipóteses. Entretanto, eu espero que o meu leitor esteja familiarizado com conceitos básicos de estatísticas, tais como: hipótese, significância estatística, estatísticas (critério estatístico), dispersão, distribuição, probabilidade, regressão, autocorrelação, etc







1. Características de uma série temporal

é evidente que o objecto de análise é uma série de preços (seus derivados), que é uma série de tempo.

Econometristas estudam série temporal do ponto de métodos de frequência (análise de espectro, análise de wavelet) e os métodos de domínio de tempo (análise de correlação cruzada, análise de autocorrelação). O leitor já foi fornecido com o artigo "Construindo análise de espectro" que descreve os métodos de freqüência. Agora eu sugiro dar uma olhada nos métodos de domínio de tempo para a análise de autocorrelação e análise de variância condicional em particular.

Modelos não-lineares descrevem o comportamento de preços de séries temporais melhor do que os lineares. é por isso que vamos nos concentrar no estudo de modelos não-lineares neste artigo.

Séries temporais de preços tem características especiais que podem ser levadas em conta apenas por alguns modelos econométricos. Primeiro de tudo, estas características incluem: "cauda gorda", clusterização de volatilidade e efeito de alavancagem.





Figura 1. Distribuições com curtose diferente.

A fig. 1 mostra 3 distribuições com curtose diferente (achatamento). Distribuição, a qual o achatamento é menor do que a distribuição normal, tem as "caudas gordas" mais frequentemente do que os outros. é mostrado com a cor rosa.



Temos que mostrar a distribuição de densidade de probabilidade de um valor aleatório, a qual é utilizada para a contagem de valores da série estudada.



Por clusterização (de aglomerado - grupo, concentração) de volatilidade queremos dizer o seguinte. Um período de tempo de alta volatilidade é seguido pelo mesmo, e um período de tempo de baixa volatilidade é seguido pelo idêntico. Se os preços estavam flutuando ontem, provavelmente eles vão fazer isso hoje. Assim, existe inércia de volatilidade. A fig. 2 demonstra que a volatilidade tem uma forma de cluster.







Figura 2. Volatilidade dos retornos diários de USDJPY, sua clusterização.

O efeito alavanca consiste na volatilidade de um mercado em queda ser mais elevado do que a de um mercado crescente. Fica estipulado pelo aumento do coeficiente de alavancagem, que depende da proporção de ativos emprestados e próprios quando os preços das ações caem. No entanto, este efeito se aplica ao mercado de ações, e não ao mercado de câmbio. Este efeito não será considerado mais adiante.







2. O modelo GARCH

Assim, nosso principal objetivo é a previsão da taxa de câmbio (preço) usando algum modelo. Econometristas usam modelos matemáticos que descrevem um ou outro efeito que pode ser estimado em termos de quantidade. Em palavras simples, eles adaptam a fórmula para um evento. E desta forma eles descrevem o evento.



Considerando que as séries temporais analisadas tem as propriedades mencionadas acima, um modelo ideal que considera estas propriedades será um não-linear. Um dos modelos não lineares mais universal é o modelo GARCH. Como ele pode nos ajudar? Dentro de seu corpo (função), ele vai considerar a volatilidade das séries, ou seja, a variabilidade de dispersão em diferentes períodos de observação. Econometristas chamam esse efeito com um termo obscuro - heterocedasticidade (do grego - hetero - diferente, skedasis - dispersão).

Se dermos uma olhada na fórmula em si, veremos que este modelo implica que a variabilidade atual de dispersão (σ2t) é afetada por ambas as mudanças anteriores de parâmetros (ϵ2t-i) e as estimativas anteriores de dispersão (as chamadas «notícia velha ») (σ2t-i):





com limites





onde: ϵt - inovações não normalizadas; α0 , βi , αi , q (ordem de membros da ARCH ϵ2), p (ordem de membros da GARCH σ2) - parâmetros estimados e a ordem das modelos.





3. Indicador de retornos

Na verdade, nós não vamos estimar a própria série de preços, mas a série de retornos. O logaritmo da variação de preço (constantemente retorna cobrado) é determinado como um logaritmo natural dos retornos percentuais:

onde:



P t - é o valor de preço da série no tempo t;



é o valor de preço da série no tempo P t-1 - é o valor de preço da série no tempo t-1;



é o valor de preço da série no tempo p t = ln(P t ) - é o logaritmo natural P t .



Na prática, a principal razão de se trabalhar com os retornos ser preferível do que trabalhar com os preços, é porque o retorno tem melhores características estatísticas.

Então, vamos criar um indicador de retorno ReturnsIndicator.mq5, que será muito útil para nós. Aqui, eu vou referir ao artigo "Indicadores personalizados para iniciantes" que, compreensivelmente, descreve o algoritmo de criação de um indicador. é por isso que eu vou lhe mostrar apenas o código onde a fórmula mencionada é implementada. Eu acho que é muito simples e não requer explicação.

int OnCalculate ( const int rates_total, const int prev_calculated, const int begin, const double & price[]) { int start; if (prev_calculated<2 ) start= 1 ; else start=prev_calculated- 1 ; for ( int i=start;i<rates_total;i++) {="" returnsbuffer[i]=" MathLog(price[i]/price[i- 1 ]); } return (rates_total); }

A única coisa que eu quero mencionar é que a série de retornos é sempre menor do que a série primária por 1 elemento. é por isso que vamos calcular a série de retornos a partir do segundo elemento, e o primeiro será sempre igual a 0.



Assim, usando o indicador ReturnsIndicator obtivemos uma série de tempo aleatória que será utilizada para os nossos estudos.







4. Testes estatísticos



Agora é a vez dos testes estatísticos. Eles são realizados para determinar se a série temporal tem quaisquer sinais que comprovem a adequação do uso de um ou outro modelo. No nosso caso, esse modelo é o modelo GARCH.

Usando o Q-test of Ljung-Box-Pierce, verifique se as autocorrelações das séries são aleatórios ou existe uma relação. Para isso, precisamos escrever uma nova função. Aqui, por autocorrelação eu quero dizer uma correlação (ligação probabilística) entre os valores das mesmas séries temporais X (t) nos momentos de tempos t1 e t2. Se os momentos t1 e t2 são adjacentes (um segue o outro), então vamos procurar uma relação entre os membros da série e os membros das mesmas séries deslocadas por uma unidade de tempo: x1, x2, x3, ... и x1+1, x2+1, x3+1, ... Tal efeito de membros deslocados é chamado de atraso (latência, retardo). O valor do atraso pode ser qualquer número positivo.

Agora eu vou fazer observação parentética e informá-lo sobre o seguinte. Até onde eu sei, nem С++ nem MQL5 têm bibliotecas padrões que cobrem cálculos estatísticos complexos e médios. Normalmente, tais cálculos são realizados usando ferramentas especiais de estatística. Quanto a mim, é mais fácil usar ferramentas como Matlab, STATISTICA 9, etc, para resolver o problema. No entanto, eu decidi recusar a utilização de bibliotecas externas, em primeiro lugar, para demonstrar o quão poderosa a linguagem MQL5 é para cálculos, e em segundo lugar... Eu mesmo aprendi muito ao escrever o código MQL.



Agora precisamos fazer a seguinte nota. Para conduzir o teste Q, precisamos de números complexos. é por isso que eu fiz a classe Complexa. Idealmente, deve ser chamado CComplex. Bom, eu me permiti relaxar um pouco. Tenho certeza que meu leitor está preparado e eu não preciso explicar o que é um número complexo. Eu pessoalmente não gosto das funções que calculam a transformação Fourier publicada no MQL5 e MQL4; Lá, números complexos são usados de forma implícita. Além disso, há outro obstáculo - a impossibilidade de anular os operadores aritméticos em MQL5. Então eu tive que procurar por outras abordagens e evitar a notação padrão 'C'. Eu implementei a classe de número complexo da seguinte forma:

class Complex { public : double re,im; //re -real component of the complex number, im - imaginary public : void Complex(){}; void setComplex( double rE, double iM){re=rE; im=iM;}; //set method (1-st variant) void setComplex( double rE){re=rE; im= 0 ;}; //set method (2-nd variant) void ~Complex(){}; void opEqual( const Complex &y){re=y.re;im=y.im;}; void opPlus( const Complex &x, const Complex &y); // void opPlusEq( const Complex &y); // void opMinus( const Complex &x, const Complex &y); // void opMult( const Complex &x, const Complex &y); // * void opMultEq( const Complex &y); // *= (1-st variant) void opMultEq( const double y); // *= ( 2-nd variant) void conjugate( const Complex &y); //conjugation of complex numbers double norm(); // normalization };

Por exemplo, a operação de soma de dois números complexos pode ser realizada utilizando o método opPlus, subtração é realizada utilizando opMinus, etc. Se você apenas escrever o código c = a + b (onde a, b, с são números complexos) então o compilador exibirá um erro. Mas ele irá aceitar a seguinte expressão: c.opPlus(a,b).



Se necessário, o usuário pode estender o conjunto de método da classe Complexa. Por exemplo, você pode adicionar um operador de divisão.

Além disso, eu preciso de funções auxiliares que processam matrizes de números complexos. é por isso que eu os implementei fora da classe Complexa, não para circular o processamento de elementos da série na mesma, mas para trabalhar diretamente com as séries passadas por uma referência. No total existem três tipos de funções:



getComplexArr (devolve uma série bidimensional de números reais a partir de uma série de números complexos); setComplexArr (retorna uma série de números complexos a partir de uma série unidimensional de números reais); setComplexArr2 (retorna uma série de números complexos a partir de uma série bidimensional de números reais).



Deve-se notar que estas funções retornam séries passados por uma referência. é por isso que seus corpos não contêm o operador de 'retorno'. Mas raciocinando logicamente, eu acho que podemos falar sobre o retorno apesar to tipo inválido.

A classe de números complexos e funções auxiliares é descrito no arquivo de cabeçalho Complex_class.mqh.



Então, quando conduzindo testes, vamos precisar da função de autocorrelação e da função de transformação de Fourier. Assim, precisamos criar uma classe nova, vamos chamá-la CFFT. Ela vai processar séries de números complexos para as transformações de Fourier. A classe de Fourier se parece com o seguinte:

class CFFT { public : Complex Input[]; Complex Output[]; public : bool Forward( const uint N); bool InverseT( const uint N, const bool Scale= true ); bool InverseF( const uint N, const bool Scale= false ); void setCFFT(Complex &data1[],Complex &data2[], const uint N); set method (1-st variant) void setCFFT(Complex &data1[],Complex &data2[]); set method (2-nd variant) protected : void Rearrange( const uint N); void Perform( const uint N, const bool Inverse); void Scale( const uint N); };

Deve-se notar que todas as transformações de Fourier são realizadas com séries cujo comprimento está de acordo com a condição de 2^N (onde N é uma potência de dois). Normalmente, o comprimento da matriz não é igual a 2^N. Neste caso, o comprimento da matriz é aumentado para o valor de 2^N para 2^N >= n, onde n é o comprimento da matriz. Elementos adicionais da série são iguais a 0. Tal processamento da série é executado dentro do corpo da função autocorr usando a função auxiliar nextpow2 e a função:pow

int nFFT= pow ( 2 ,nextpow2( ArraySize (res))+ 1 );

Então, se temos uma série inicial cujo comprimento (n) é igual a 73585, então a função nextpow2 retornará o valor 17, onde 2^17 = 131072. Em outras palavras, o valor retornado é maior do que n by pow(2, ceil(log(n)/log(2))). Então vamos calcular o valor de nFFT: 2^(17+1) = 262144. Este será o comprimento da série auxiliar, cujo elementos de 73585 a 262143 serão igual a zero.

A classe de Fourier é descrita no arquivo de cabeçalho FFT_class.mqh.

Para economizar espaço, eu vou pular a descrição da implementação da classe CFFT. Os que estão interessados podem dar uma olhada no arquivo incluído em anexo. Agora vamos passar para a função de autocorrelação.

void autocorr( double &ACF[], double &res[], int nLags) { Complex Data1[],Data21[], Data2[],Data22[], cData[]; double rA[][ 2 ]; int nFFT= pow ( 2 ,nextpow2( ArraySize (res))+ 1 ); ArrayResize (rA,nFFT); ArrayResize (Data1,nFFT); ArrayResize (Data2,nFFT); ArrayResize (Data21,nFFT); ArrayResize (Data22,nFFT); ArrayResize (cData,nFFT); double rets1[]; double m=mean(res); ArrayResize (rets1,nFFT); for ( int t= 0 ;t< ArraySize (res);t++) rets1[t]=res[t]-m; setComplexArr(Data1,rets1); CFFT F,F1; F.setCFFT(Data1,Data2); F.Forward(nFFT); for ( int i= 0 ;i<nFFT;i++) { Data21[i].opEqual(F.Output[i]); cData[i].conjugate(Data21[i]); Data21[i].opMultEq(cData[i]); } F1.setCFFT(Data21,Data22); F1.InverseT(nFFT); getComplexArr(rA,F1.Output); for ( int i= 0 ;i<nLags+ 1 ;i++) { ACF[i]=rA[i][ 0 ]; ACF[i]=ACF[i]/rA[ 0 ][ 0 ]; } }

Assim, calculamos os valores de ACF para o número específico de atrasos. Agora podemos usar a função de autocorrelação para o teste Q. A própria função de teste se parece com o seguinte: