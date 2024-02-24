Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2802
Uma vez você criou um script que decidi usar novamente.
Não consigo entender onde encontrar o erro e como corrigi-lo. Talvez você saiba, já que usa essas bibliotecas/pacotes?
Tudo funcionou bem em uma amostra binária.
O erro diz que valores indefinidos (NA) apareceram na matriz de correlação e a função findCorrelation não pode usá-la. Abra o pacote e leia a descrição da função.
Os scripts são confusos e um mar de resultados intermediários desnecessários. Abaixo está o script corrigido
Explicações em ordem:
1. Não é necessário carregar o pacote "caret" no escopo global. Ele é muito pesado, puxando muitas dependências e dados. Você só precisa de uma função dele. Você a importa diretamente para a função get.findCor.
O pacote tidyft é um pacote de manipulação de dataframe muito rápido. Use-o.
Para controle, testei no meu kit usando esse script. Resultado:
Ele conta por um tempo bastante longo (12,9 min). Mas o quadro também não é pequeno. É claro que precisamos paralelizá-lo e procurar uma função cor mais rápida.
Dos 21 preditores iniciais com diferentes limites, selecionamos diferentes números de preditores.
Mas esse não é o caminho a seguir.
Boa sorte
Você não prestou atenção à variabilidade do sd
Vou prestar atenção da próxima vez, vou contar o sd do sd do sd do sd do sd %)
A vinculação do deslocamento da janela de recursos a algum indicador (por exemplo, std) não produziu nada
quanto maior o valor, maior o múltiplo do deslocamento desse valor.
ou vice-versa. Tentei os dois.
Há também uma variante de expansão e estreitamento (+ deslocamento?), mas ainda não tentei.
Só consigo ver uma enumeração dessas variantes dentro da estrutura dos fractais.
Uau, é oco
Vladimir, você sabe se existe um pacote para backtest que mantém um registro de transações e tudo mais (bem, não é para ser primitivo), exceto para os lentos "quantstrat" e "SIT"?
Com certeza.
Tudo precisa ser recalculado a cada etapa.
Acho mais fácil percorrer as formas de recalcular rótulos e recursos em um grande conjunto de dados do que treinar novamente cada barra, pois ficarei preso por muito tempo.E, com o retreinamento frequente, você determina algum padrão geral, se o observar globalmente. A menos que esse design esteja sendo usado, é claro.
Para mim, é mais fácil analisar maneiras de recalcular rótulos versus chips em um grande conjunto de dados do que treinar novamente cada barra, pois eu ficaria preso por muito tempo
Concordo plenamente, esse é o motivo pelo qual não posso mudar para o EA.
Mas é uma questão de princípio. Mudei para o esquema "ensinar a cada etapa" por causa do olhar oculto à frente, que surge devido à preparação de todo o conjunto de dados. Tenho exatamente esse problema e não consegui encontrar preditores que gerem o efeito de "olhar para frente".
O gráfico Embargo é mais ou menos assim chamado.
Uma vez que o treinamento foi reduzido para 1 dia e o teste para 1 dia. E observou a previsão da marcação com alguns dias de antecedência. Ou seja, ele viu o que acontecerá com as novas barras. Os resultados foram muito bons.
Com o aumento do intervalo de treinamento para até uma semana, o resultado também foi superior a 50/50. Bem, quanto mais - pior, as linhas com marcação foram adicionadas às linhas sem marcação e estragaram tudo))))
.
Em geral, esse gráfico de embargo não deve ser menos do que um "peek-ahead" para o professor.
Uau, isso é uma coisa oca
Vladimir, você sabe se existe um pacote para backtest que mantém um registro das transações e tudo mais (bem, não para ser primitivo), exceto para os lentos "quantstrat" e "SIT".
Eu não sei. Não conheço