Da teoria à prática - página 336

 
Alexander_K2:

Último post para hoje.

Portanto. A pergunta mais ardente que Novaja uma vez fez:

Por que converter o fluxo de corrente, que na verdade é um fluxo Erlang, para um fluxo exponencial, para então voltar ao mesmo, mas já claramente distorcido???

Eu concordo - um erro foi cometido aqui. Deve-se trabalhar com o fluxo de carrapatos existente e realizar mais transformações sobre este fluxo de fonte natural, não artificial.

Portanto, o algoritmo de transformação parece ser o seguinte:

1. tomamos o tick stream inicial mas lemos cada segundo tick em seu lugar - veja as distribuições obtidas para intervalos de tempo e incrementos.

2. ... cada terceiro tick é lido - analisamos as distribuições.

3. ...

Até que a distribuição dos intervalos de tempo adquira um fluxo Erlang claro e distinto que satisfaça as fórmulas para a função de densidade de probabilidade, e a distribuição dos incrementos se aproxime cada vez mais de uma distribuição normal.

Isso é o que farei, e lhe informarei os resultados.

Obrigado por sua atenção.

este é apenas o começo de anos de dolorosas pesquisas, baseadas em hipóteses e com muitos cólons

e qual é a conclusão, como um graal?

é como um graal...

 
Alexander_K2:

Último post para hoje.

Portanto. A pergunta mais ardente que Novaja uma vez fez:

Por que converter o fluxo de corrente, que na verdade é um fluxo Erlang, para um fluxo exponencial, para então voltar ao mesmo, mas já claramente distorcido???

Eu concordo - um erro foi cometido aqui. Deve-se trabalhar com o fluxo de carrapatos existente e realizar mais transformações sobre este fluxo de fonte natural, não artificial.

Portanto, o algoritmo de transformação parece ser o seguinte:

1. tomamos o tick stream inicial mas lemos cada segundo tick em seu lugar - veja as distribuições obtidas para intervalos de tempo e incrementos.

2. ... cada terceiro tick é lido - analisamos as distribuições.

3. ...

Até que a distribuição dos intervalos de tempo adquira um fluxo Erlang claro e pronunciado que satisfaça as fórmulas para a função de densidade de probabilidade, e a distribuição dos incrementos se aproxime cada vez mais de uma distribuição normal.

É o que farei e lhe informarei os resultados.

Obrigado por sua atenção.

Ao ler cada segundo, depois o terceiro e assim por diante a cada n-ésimo tick, você realmente recebe um gráfico das faixas de preço de fechamento.

E as distribuições deste quadro eu já preenchi.

No início você terá o pico central decrescendo, ele começará a se desfocar mais perto do normal e então a distribuição se tornará bimodal.

Para entender o processo que você precisa estudar nas bordas e as medidas das bordas é que com n=1 você se aproxima de uma distribuição log-normal e com o aumento de n mais próximo de n=100 você tem uma distribuição bimodal. Isto significa que a distribuição sempre foi bimodal, só que, devido à discreção em pequenos n, ela se sobrepõe uma à outra e o quadro não é claro.

Portanto, sua pesquisa é uma invenção da bicicleta.

 
Yuriy Asaulenko:

Não, isso não é maneira de se vender um elefante.

A_K2 se caracteriza pela completa falta de uma abordagem sistemática e de aprofundamento nos detalhes. Que detalhes quando não há uma visão do todo?

Além disso.

Desejo sinceramente que o A_K2 produza algo que realmente funcione. Entretanto, a julgar por seus postos, desta vez também será um tiro em branco.

O progresso, a ciência e a tecnologia sempre mudaram de formas simples (descrições) para formas mais complexas. E, é preciso dizer, os simples já funcionaram bastante bem.

Se você nunca projetou um carro, não há perspectiva de começar com um Mercedes. Você deve começar com algo simples, algo como Zhiguli - os princípios são os mesmos da Mercedes, mas tudo é muito mais simples. Quando seu Zhigul começa a se mover, você pode melhorar, modernizar, complicar e elevá-lo ao nível da Mercedes. Lembre-se, como eram os carros coreanos há 15 anos - não se pode deixar de chorar.

Parece que o A_K2 novamente começou a projetar o Mercedes). Ele poderia ser construído pelo menos em Zhigul durante 4 meses anteriores - não precisa de nenhuma ciência para projetá-lo, e as soluções técnicas são suficientes).

 
Alexander_K2:

Você tem que trabalhar com o fluxo do tick-stream que você tem e fazer outras transformações neste fluxo de fonte natural, não em uma fonte artificial.

Já escrevi a você sobre isso, mas aparentemente minha voz não é suficiente.
Seus "tiques reais" são algo incomum. Não sei o que está por trás desse "DDE", mas não é de forma alguma o lixo casual que a cobrança de divisas costuma dar. Pelo menos os carrapatos são 10 vezes menos freqüentes do que o normal, o que já é alarmante. O primeiro bolso em seu histograma deve ser de ~200ms, não um segundo.

Por favor, coloque no csv alguns milhares de últimos carrapatos recebidos, nenhum desbaste, nenhum preenchimento de espaços em branco com valores passados, mas apenas os preços que vieram. Talvez alguém possa usá-los e confirmar, que esses valores são muito mais aceitáveis para o comércio do que o normal. E então talvez a inteligência coletiva nesta linha sugira como fazer um graal com eles em uma dúzia de linhas de código mql.

 
Alexander_K2:

E você não tem que converter nada? Eu não acredito!!!!!!!! Isso não é interessante.

O princípio do grande processamento de dados é sempre trabalhar com dados brutos que tenham o máximo de informação, mas adicionar diferentes métricas a eles, ou encolhê-los sem perder informação.

Se você começar a mascarar as informações, é óbvio que o valor e a adequação de tais algoritmos diminui imediatamente.

 
Alexander_K2:

Mas há seis meses discutimos que, como diferentes corretores têm diferentes fluxos de tick-flows, a prioridade é levá-los a uma única visão universal. Não?

Uma não contradiz a outra.

Uma visão universal não significa que é necessário trazê-los ao mesmo fluxo de tiquetaque...
 

Obrigado, aqui está uma comparação das distribuições de ganhos, e autocorrelações para os últimos 1000 valores de licitação do audcad. A fila superior é o seu carrapato. A linha inferior é o que está no terminal. Há uma diferença, mas não posso dizer dos gráficos o que é melhor. Eu gosto que o pico do histograma não seja abreviado como no terminal.

Alguns testes de estacionaridade:

Seus carrapatos são.

> Box.test(pricesDiff, lag=20, type="Ljung-Box")

        Box-Ljung test

data:  pricesDiff
X-squared = 39.466, df = 20, p-value = 0.005832

> adf.test(pricesDiff, alternative = "stationary")

        Augmented Dickey-Fuller Test

data:  pricesDiff
Dickey-Fuller = -11.556, Lag order = 9, p-value = 0.01
alternative hypothesis: stationary

> kpss.test(pricesDiff)

        KPSS Test for Level Stationarity

data:  pricesDiff
KPSS Level = 0.44326, Truncation lag parameter = 7, p-value = 0.05851


E os que estão no terminal:

        Box-Ljung test

data:  pricesDiff
X-squared = 29.181, df = 20, p-value = 0.08426

> adf.test(pricesDiff, alternative = "stationary")

        Augmented Dickey-Fuller Test

data:  pricesDiff
Dickey-Fuller = -10.252, Lag order = 9, p-value = 0.01
alternative hypothesis: stationary

> kpss.test(pricesDiff)

        KPSS Test for Level Stationarity

data:  pricesDiff
KPSS Level = 0.3404, Truncation lag parameter = 7, p-value = 0.1


O valor de p em seu teste Box-Ljung é uma ordem de magnitude mais baixa, o que é legal.


E o mais importante, seus carrapatos são um processo com memória, é muito desmarcado. Não sei como expressá-lo em números, mas em meu modelo seus carrapatos são mais fáceis de prever do que os carrapatos normais.


Estou me perguntando se existem outros testes para avaliar a previsibilidade?

 

Distâncias entre carrapatos do arquivo de Alexander 01AUDCAD_Real 14400 (incrementos de 1 segundo)


 
Alexander_K2:

Se for esse o caso, então obviamente todos deveriam trabalhar em um fluxo discreto de citações como a minha e é isso. Não é verdade?

Era o que eu pensava há um mês também. Como você tinha uma distribuição logarítmica (ou pascal), eu queria obter uma também por desbaste para ficar bom. Depois de algumas semanas e tentando "Vou mudar p para 0,71 ao invés de 0,72 e tudo ficará bem". - Eu nunca acertei, é tudo uma fita métrica, não uma ciência.

A distribuição dos ganhos de preço e as pausas de tempo são apenas conseqüências. O mais importante é obter um processo estacionário não-markoviano. E quanto mais estacionário e não-markoviano - melhor. Penso que esta é a primeira transformação necessária com a exigência de estacionaridade não-markoviana e não importa que distribuições produz.
Não tenho idéia de como alcançar esta esta estacionariedade não-markoviana, mas parece ser o caminho certo.

Então, para uma série tão fina, pode-se tentar fazer uma segunda conversão de acordo com a estratégia comercial. Como conseguir uma gama em retornados, como você queria para seu modelo. Aqui a transformação depende de sua estratégia, você pode criar características e treinar o neurônio em vez de um segundo desbaste.


p.s. -"estacionariedade não-markoviana" é um nome puramente pessoal e profano para este bem. Na ciência, provavelmente é chamado de forma diferente.

 
Novaja:

Distâncias entre carrapatos do arquivo de Alexander 01AUDCAD_Real 14400 (discreção de 1 seg.)

A julgar pelo gráfico de algumas páginas atrás - o pico mudou de 0 para 1. Acho que depende do par negociado (audcad e cadjpy)


Alexander_K2:

Eu acho que é uma distribuição Pascal com r=2, p=0,5, q=0,5

Tentei desenhar a distribuição de Pascal com tais parâmetros em R, ela não coincidiu. Mas existem outras notações em vez de r,p,q, talvez eu tenha estragado alguma coisa.

Razão: