Volumes, volatilidade e índice Hearst - página 6

 

Tabela 2a
n N K R M D
2 4 52000 2.3818 1.5070 4.0252
3 8 56000 3.6364 2.1770 7.9456
4 16 95000 5.4861 3.1450 15.9989
5 32 134000 8.1050 4.4831 32.0493
6 64 185000 11.8046 6.3378 63.6909
7 128 250000 17.1001 9.0244 128.6451
8 256 317000 24.5862 12.7986 257.5228
9 512 481000 35.1518 18.0730 513.5267
10 1024 639000 50.0614 25.5199 1022.8466
11 2048 936000 71.2224 36.1104 2048.1000
12 4096 1381000 101.1421 51.0515 4097.8097
13 8192 1640000 143.4602 72.2285 8198.6059
14 16384 2452000 203.3874 102.2592 16425.9632
15 32768 3183000 287.8928 144.5695 32858.2299
 
Tabela 2b
n N LOG(R) LOG(M) LOG(D) LOG(N) Hurst
2 4 1.2520 0.5917 2.0090 2.0000
3 8 1.8625 1.1224 2.9902 3.0000 0.6105
4 16 2.4558 1.6531 3.9999 4.0000 0.5932
5 32 3.0188 2.1645 5.0022 5.0000 0.5630
6 64 3.5613 2.6640 5.9930 6.0000 0.5425
7 128 4.0959 3.1738 7.0073 7.0000 0.5346
8 256 4.6198 3.6779 8.0086 8.0000 0.5238
9 512 5.1355 4.1758 9.0043 9.0000 0.5158
10 1024 5.6456 4.6735 9.9984 10.0000 0.5101
11 2048 6.1543 5.1743 11.0001 11.0000 0.5086
12 4096 6.6602 5.6739 12.0006 12.0000 0.5060
13 8192 7.1645 6.1745 13.0012 13.0000 0.5043
14 16384 7.6681 6.6761 14.0037 14.0000 0.5036
15 32768 8.1694 7.1756 15.0040 15.0000 0.5013
 

A terceira coluna da Tabela 2a mostra o valor de K - o número de intervalos que tiveram que ser gerados para obter a precisão dada acc=0,001. Se levarmos em conta que o número total de todas as trajetórias possíveis é 2^N, então a partir de N=32 o número K é uma fração minúscula deste número total. E com o aumento do N, esta fração diminui rapidamente.

No entanto, do ponto de vista prático, isto é de pouca alegria. O intervalo N=16384, com base na densidade de carrapatos em 2009, corresponde a cerca de um dia. Para calcular a faixa média R com uma precisão de 0,001 em um mercado estacionário, seriam necessários 2452000 dias de negociação (ou seja, 9430 anos). É pouco provável que seja de interesse para alguém. Entretanto, se a precisão for reduzida significativamente, poderá ser possível chegar a conjuntos de dados estatísticos adequados.

A sexta coluna(D) da Tabela 2a coincide em valores com a segunda(N), e a nona com a décima(LOG(D)=LOG(N)), como deve ser de acordo com a fórmula anteriormente dada para a variância dos incrementos. E os valores de R em N=4, 8 e 16 coincidem com os valores correspondentes da tabela anterior, onde são dados os valores teóricos exatos do spread médio. Ou seja, o nível de precisão escolhido e os tamanhos de amostra K correspondentes garantem a confiabilidade dos dados resultantes.

O interesse principal é a última coluna, onde são dados os valores do índice Hurst. O resultado na n-ésima fila foi calculado usando dois pontos, o n-ésimo e o anterior. Teoricamente, para a SB considerada o índice Hurst deveria ter sido igual a 0,5. Entretanto, como podemos ver, este não é o caso. Para valores pequenos do intervalo N o expoente difere significativamente de 0,5 e somente com o aumento do N tende a 0,5, aparentemente de forma assimptótica. Gostaria de sublinhar a natureza fundamental deste ponto: escolhendo diferentes valores de intervalos nos quais dividimos as séries para calcular a relação Hurst, obteremos valores absolutamente diferentes. Portanto, tentando avaliar o caráter do SR usando o índice Hurst, devemos ter uma curva tabulada para SB pura (esta é a calibração necessária) com a qual comparar os dados do experimento, ou usar intervalos muito grandes. Ambas as variantes são praticamente inaceitáveis para uso real.

 

Para ilustrar, são mostradas parcelas de R, M e D versus N no Log-Log coordenadas.

A linha vermelha mostrando a dependência da LOG(R) da LOG(N) não é uma linha reta. Para mostrar isto, duas linhas Linha 1 e Linha 2 são desenhadas no gráfico. O primeiro através do primeiro par de pontos da curva vermelha, o segundo através do último par. O índice Hurst é definido como a tangente de sua inclinação para o eixo X e, como pode ser visto no gráfico, este ângulo de inclinação varia de ponto para ponto.

A linha LOG(M) também é uma curva, embora não tão curvada quanto a LOG(R). Tem a mesma assimptose 0,5 e, portanto, nunca se intercepta com a curva vermelha. Dos três, apenas a linha LOG(D) é uma linha reta.

Em princípio, qualquer uma destas três linhas poderia ser usada para calcular o índice Hurst. Entretanto, infelizmente, não há preferência por nenhum deles. Cada uma das linhas tem suas vantagens, mas também suas desvantagens. As desvantagens são, infelizmente, tão significativas que fazem uso prático no comércio ineficaz.

Assim, tiramos as seguintes conclusões.

A Relação Hearst não é uma característica "boa" do mercado, pois depende dos parâmetros da divisão das séries temporais em intervalos. A fim de obter resultados adequados, esta dependência deve estar disponível e ser utilizada para levá-los à forma normal.

O índice Hurst é significativo como uma característica global de séries estacionárias com estatísticas bastante grandes. Um processo de mercado não tem a propriedade de estacionaridade e requer características locais com um curto tempo de atraso para sua descrição. O uso do expoente Hurst nesta capacidade é muito problemático.

 
Entretanto, alguém no fórum persistiu em argumentar que a Hirst poderia ser útil. Quem foi?
 

Muito útil, limpou a pasta - meia dúzia de indicadores a menos.

 
Mathemat:
Entretanto, alguém no fórum persistiu em argumentar que a Hirst poderia ser útil. Quem foi?


Fui eu? :-)

 
Não é o Neutron?
 
joo:
Não é o Neutron?

Acho que nunca descobrimos como calculá-lo corretamente (quero dizer clássico) https://www.mql5.com/ru/forum/102239/page13
 
No que diz respeito à série de modelos SB considerados neste caso, estou confiante de que o cálculo está correto. Entretanto, se estamos falando de filas arbitrárias, ainda é preciso trazê-las para uma forma apropriada lá. Caso contrário, pode acabar se tornando um absurdo. Ainda precisamos pensar sobre este procedimento de redução.
Razão: