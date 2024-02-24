Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2129
Vocês são robôs?
Trabalhar dia e noite sem dormir ou descansar ))))
Fusos horários... mas ainda impressionante))))
7 dígitos é suficiente.
Aqui está um histograma do equilíbrio - novos modelos em azul, modelos antigos em vermelho.
Todas as configurações são as mesmas.
Relevância do prognóstico
Os modelos usam o tempo ao máximo. É difícil dizer se é bom ou ruim, mas é meio ruim quando algum preditor obtém uma vantagem devido à semelhança com os analógicos.
Relembrar
Precisão
No final há uma diferença, não uma grande, claro, mas ainda assim.
O balanço não é mau.
Você alimenta os minutos na versão antiga? Caso contrário, alimente-os para uma comparação adequada. Na versão seno + co-seno são contabilizados. Ou retire os minutos do syn+kos se for mais rápido.
Então, o tempo seno + coseno é melhor do que apenas números?
A métrica que eu forneci - parece pior. A razão é mais provável que atinja um conjunto aleatório de preditores para construir uma árvore de predição dividida associada ao tempo.
Sim, eu não usei minutos na minha versão antiga.
Você fez um catbustom? Não deve haver ali uma selecção aleatória de preditores. Os impulsionadores usam todos os preditores, mas árvores rasas.
Em uma floresta aleatória, sim. É definido, por exemplo, por
O número de características a considerar quando se procura a melhor divisão:
Sim, eu não usei minutos na minha versão antiga.
Talvez tenham piorado o resultado? Tente na nova versão removê-las.
É isso, deve ser uma analogia completa com a sua versão antiga.
if(nameInd[nInd]=="Hour") {CopyTime (sim,per,startDt,n_bar+1,dtm);TimeToStruct(dtm[0],dts);ArrayResize(tmp,1);tmp[0]=(double)(dts.hour)*360.0/24.0;tmp[0]=(buf==0?MathSin(tmp[0]*pi/180.0):MathCos(tmp[0]*pi/180.0));}
if(nameInd[nInd]=="WeekDay") {CopyTime (sim,per,startDt,n_bar+1,dtm);TimeToStruct(dtm[0],dts);ArrayResize(tmp,1);tmp[0]=(double)(dts.day_of_week)*360.0/7.0;tmp[0]=(buf==0?MathSin(tmp[0]*pi/180.0):MathCos(tmp[0]*pi/180.0));}
Quanto à aleatoriedade - já há o suficiente.
Não ficou surpreso, que eu tenha tempos separados com seno e cosseno, enquanto agora entendo, deve haver um, mas seno e cosseno são usados?
Daí a questão, o que é buf, e por que quando é igual a zero, tomamos um cosseno?
O buf é o número do buffer.
Para o tempo há 2. Há indicadores com 1 tampão, há mais de 2.
Eu faço loop através do número de buffers no meu loop quando componho colunas para o conjunto de treino.
Tens de alimentar tanto seno como cosseno, não apenas um. Veja https://megaobuchalka.ru/9/5905.html para uma explicação.
Osdados numéricos parecem ser desnecessários para codificar. Mas, em alguns casos, é razoável codificar também os dados numéricos [22]. Ao codificar dados numéricos, é necessário levar em conta o significado dos dados, a localização dos valores na faixa de valores e a precisão da medição dos dados. Isto é ilustrado por exemplos. Por exemplo, a codificação permite que a significância dos dados seja levada em conta. Se a entrada numa rede for um ângulo entre duas direcções, por exemplo, a direcção do vento, nunca é apropriado alimentar o ângulo (em graus ou radianos) na rede. Uma tal entrada faria a rede "aprender" que 0 graus e 360 graus são a mesma coisa. Faz mais sentido alimentar o seno e o cosseno desse ângulo como entrada. O número de sinais de rede de entrada aumenta, mas os valores de entrada fechados são codificados por sinais de entrada fechados.
Por isso, fiz tudo bem originalmente - já não me lembro do que estava a fazer...
Apenas o número de minutos a partir de segunda-feira 0:00 = Mas é má ideia. Para chegar, por exemplo, aos primeiros 10 minutos de cada hora, você teria que fazer muitas separações.
Provavelmente é melhor como tu - apenas dias, horas. E talvez minutos.
Não podemos fazer apenas uma entrada em vez de 4?
Já começaram a treinar sem minutos - vamos ver.
Eu ainda uso 1/4 bar de tempo - horas, 4 horas, dias.