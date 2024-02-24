Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 1144
Eu não diria "exatamente assim", a fórmula em si é correta, mas não deve ser calculada por retornos de negócios, mas por retornos diários (horários, etc.). Não me parece, a fórmula em si está correcta, mas precisamos de comparar estratégias não por retornos de ordens, mas por retornos diários (horários, etc.), pelo mesmo passo, para todos os estratagemas, então podemos compará-las por performance dependendo deste valor de coeficiente, caso contrário se este número for calculado por ordens e o seu número significativamente diferente, não é importante, por exemplo 0.01 Sharpe para uma estratégia e 5 para outra, não é claro qual delas é melhor ou pior, apenas o sinal (acima ou abaixo de zero Sharpe) é importante.
Então, embora pantural não esteja exatamente falando sobre o clássico Sharpe Ratio, mas mesmo assim ele levantou uma questão importante sobre isso. Embora eu pessoalmente não prefira usar o Sharpe Ratio, prefiro o Ratio of Profit to Maximum Drawdown como medida de desempenho da estratégia.
em qualquer caso, a pantural já não tem como objetar :))O que estás a fazer agora, apenas a vaguear por aí? Não queres discutir algumas coisas normais no campo MO? :) Eu preciso de uma pessoa que saiba muito sobre fórmulas. O tema ficou vazio, não há ninguém com quem discuti-lo.
Em princípio, estou pronto a dar a minha opinião sobre qualquer assunto. Mas a disponibilidade de sentido para vocês nas minhas declarações não posso garantir)
Atirei-te a informação do bandido? É um tópico muito interessante, mas com muitas fórmulas.
Sim, eu acho que sim. Mas atualize o link e escreva o que aproximadamente interessa.
o link acima, interessado em bandidos adversários para processos não estacionários, com algoritmos combinatórios (aparentemente, algo como mgua). eu mesmo no processo de familiarizar-se com a informação ainda
mais sobre isso depois
No livro deles, encontrei isto imediatamente:
Tudo o que o aprendiz sabe é que o verdadeiro ambiente está em algum conjunto E chamado de classe ambiental.
Como você vê este E definido para negociação?
Bem, é um ambiente arbitrário para um bandido, por exemplo, um conjunto de indicadorespor exemplo, um indicador rsi, para simplificar, um conjunto de incrementos múltiplos de preços
No entanto, não entendo como o seu modelo se relaciona com a negociação. Da sua definição de estratégia (política) decorre que apenas olham para as acções realizadas e para os seus resultados. Sobre o ambiente (na sua opinião - um conjunto de indicadores) eles não o vêem ou nem conseguem vê-lo.
At deve depender apenas do histórico Ht-1 = (A1 , X1 , . . . . , At-1 , Xt-1 ). Uma política é um mapeamento das histórias para as ações.
Além disso, seu ambiente parece até ser capaz de acompanhar nosso comportamento e, portanto, a recompensa dependerá não só da ação em si, mas também de toda a sua pré-história.
Um ambiente é um mapeamento de seqüências históricas que terminam em ações para recompensas.
Se a política for aproximada por algum modelo (digamos linear), então só conseguimos uma solução sobre os novos dados e pronto, substituindo-os pelo modelo
o que você está descrevendo é um processo de encontrar as maiores recompensas
O principal problema com a não-estacionariedade é quando ela pára de trabalhar com os novos dados. Os bandidos instáveis estão lá descritos, mas ainda não cheguei até eles. É verdade que não há lá nada que eu já não saiba, como acontece :) Mas precisa de algumas ideias{soluções sobre como dar recompensas adequadamente
A propósito, ontem eu implementei exatamente o bandido linear, o resultado é algo parecido com isto:
Na verdade, o exemplo ainda é descrito no meu artigo, mas usa uma floresta aleatória em vez de uma floresta linear. Linear deve ser menos sobretreinado
Para ensinar sobre o futuro e testar sobre o passado é algo que você só vê neste fórum))))