Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2536

 
Aleksey Nikolayev #:

Um cientista respeitável escreveu que o preço deve ser necessariamente logarítmico e todos os teóricos continuam cegamente a fazê-lo.

John Tukey? Ou Box e Cox?

 
transcendreamer #:

John Tukey? Ou Box e Cox?

Talvez o Eugene Fama na sua tese, mas não tem a certeza.

 
Renat Akhtyamov #:

Acho que já cá esteve antes.

Bem, o problema do flat e da tendência vai voltar a surgir.


...........

O método é o seguinte:

1)Você tem algum tipo de modelo (por exemplo, regressão linear)

2) Você tem um certo conjunto de observações das quais não tem a certeza.

Depois crie algum ruído aleatório e combine-o com um conjunto de observações, repita várias vezes.

Depois compare o comportamento do modelo nos diferentes conjuntos resultantes, e tire algumas conclusões.

Opcionalmente, podemos selecionar o comportamento mais estável como o preferido.

Esta não é uma varinha de condão, mas apenas uma ferramenta de análise e possível ligeira melhoria, não torna o modelo errado correcto.

 
LenaTrap #:

...........

O método é o seguinte:

1)Você tem algum tipo de modelo (por exemplo, regressão linear)

2)Alguns conjuntos de observações sobre as quais você não tem certeza

Depois crie algum ruído aleatório e combine-o com um conjunto de observações, repita várias vezes.

Depois compare o comportamento do modelo nos diferentes conjuntos resultantes, e tire algumas conclusões.

Opcionalmente, podemos selecionar o comportamento mais estável como o preferido.

Esta não é uma varinha mágica, mas apenas uma ferramenta de análise e possível ligeira melhoria, ela não transforma um modelo errado em um modelo certo.

Não está claro. Há uma série determinista e um modelo que a descreve com 100% de precisão. Você adiciona ruído e a precisão do modelo é de 52%. Qual é o objectivo desta acção?
 
Dmytryi Nazarchuk #:
Não está claro. Há uma série determinista e um modelo que a descreve com 100% de precisão. Você adiciona ruído - a precisão da descrição do modelo é de 52%. Qual é o significado desta acção?

Em código morse e comunicadores. Vem de lá.

 
LenaTrap #:

...........

O método é o seguinte:

1)Você tem algum tipo de modelo (por exemplo, regressão linear)

2)Alguns conjuntos de observações sobre as quais você não tem certeza

Depois crie algum ruído aleatório e combine-o com um conjunto de observações, repita várias vezes.

Depois compare o comportamento do modelo nos diferentes conjuntos resultantes, e tire algumas conclusões.

Opcionalmente, podemos selecionar o comportamento mais estável como o preferido.

Esta não é uma varinha mágica, mas simplesmente uma ferramenta de análise e possível ligeira melhoria, ela não transforma o modelo errado no modelo certo.

Apenas em certas situações, e há um conjunto de situações em que não funciona. A única esperança é que pela lógica, o que nem sempre é o caso, haja menos situações em que não funcione.

 
Dmytryi Nazarchuk #:
Não está claro. Há uma série determinista e um modelo que a descreve com 100% de precisão. Você adiciona ruído - a precisão da descrição do modelo é de 52%. Qual é o significado desta acção?

Se você pode obter valores exatos desta série, não há nenhum ponto. Se você só pode obter valores aproximados, o ponto é suficientemente simples, para verificar se o resultado do modelo é o erro das suas medições imprecisas da série original (ideal). Há fórmulas e definições matemáticas precisas para isto, mas não as entendo.

 
LenaTrap #:

Se você pode obter valores exatos desta série, não há nenhum ponto. Se você só pode obter valores aproximados, então o ponto é suficientemente simples, para verificar se o resultado do modelo é um erro das suas medições imprecisas da série original (ideal). Há fórmulas e definições matemáticas precisas para isto, mas não as entendo.

A questão é a confiabilidade de isolar o procurado, não a exatidão dos valores. Há o desejado, misture em 10%, selecione 99, misture em 50, selecione 80 ou 20... tudo depende do algoritmo de seleção dos dados que estão sendo pesquisados.

Bem, depende da qualidade do barulho, claro. Podes ver qualquer sinal se souberes o sinal.
 
LenaTrap #:

Se você pode obter valores exatos desta série, não há nenhum ponto. Se você só pode obter valores aproximados, então o ponto é suficientemente simples, para verificar se o resultado do modelo é um erro das suas medições imprecisas da série original (ideal). Há fórmulas e definições matemáticas precisas para isso, mas não as entendo.

Não é para regressão.
 
elibrarius #:
Preenchi os preditores e produzi aleatoriamente. Só para garantir que a aprendizagem não é possível. Certificou-se de que era 50/50%.
Com as aspas e com o alvo em TP=SL também é 50/50%.

Mas e se o alvo não for definido aleatoriamente?

Aqui eu tentei uma experiência - minha amostra normalmente é dividida em 3 partes, então eu as fundi em uma amostra e treinei o modelo com 100 árvores, depois verifiquei quais preditores não foram usados e os bloqueei. Depois treinei o modelo como de costume com uma paragem no overtraining na segunda amostra, e comparei os resultados na terceira amostra com a variante quando treino sem excluir os preditores. Acontece que os resultados foram melhores nos preditores selecionados, e aqui eu acho difícil concluir este efeito pensando "a seleção de diferentes preditores é devido à diferença nas amostras no intervalo, treinando em toda a amostra selecionamos automaticamente os preditores que não perdem seu significado com o tempo". No entanto, isso significa que quanto maior a amostra, mais robusto o modelo no longo horizonte? Os prognósticos podem ser seleccionados para a aprendizagem desta forma, ou seja, não contribui para o excesso de aprendizagem? Em geral ouvi recomendação dos fundadores da CatBoost de que é necessário encontrar hiperparâmetros de modelo, e depois estupidamente treinar em todas as amostras acessíveis para aplicação do modelo no trabalho.


elibrarius #:
Havia uma variante com 47,5% de erro, parecia fixe, mas quando a liguei ao MT tester acabou por ser uma queda em vez de crescimento. Acontece que eu não levei em conta a comissão, ela comeu aquela vantagem de 2%.

Aqui está a pensar em como prestar contas da comissão...
Eu queria adicionar 4 pts ao spread. Mas isso não está certo. Porque TP e SL serão às vezes acionados por perguntas exageradas, não naquela barra, onde deveria estar no testador, devido a isso a ordem das negociações subseqüentes pode mudar.
Mas o testador usa o spread mínimo na barra, ele também diferirá da realidade.

Eu ainda não descobri a melhor maneira.

Se o mercado se moveu na direcção de A por 100 pontos, então a dependência do spread não deve existir de todo - o resultado financeiro depende apenas do spread - creio que não deve ser tido em conta na formação. Suponha que eu tenha entradas no mercado, depois de o modelo as confirmar ou não, e ao marcá-las eu tenho a possibilidade de apenas alargar virtualmente o spread - ou seja, se o lucro for inferior ao número de pontos especificado, então não entre. O spread também é levado em conta na análise do modelo, quando o resultado é calculado puramente por amostragem - eu simplesmente subtraio um número especificado de pontos do resultado financeiro do negócio.

Nas paragens Moex são accionadas onde o preço estava, por isso é claro que é mais fácil com isso.