Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2215
Você está perdendo oportunidades de negociação:
- Aplicativos de negociação gratuitos
- 8 000+ sinais para cópia
- Notícias econômicas para análise dos mercados financeiros
Registro
Login
Você concorda com a política do site e com os termos de uso
Se você não tem uma conta, por favor registre-se
Voltando à questão da visualização do modelo CatBoost, a fim de analisar a sua perspectiva.
Este é o aspecto do modelo na amostra de treino:
O eixo x é o valor de probabilidade da função logística, e o eixo y é a porcentagem sobre um intervalo de 0,05 valores:
- Razdel(azul) - todos os valores da amostra.
- Target=1(íman) - valores do target 1
- Target=0(aqua) - valores alvo 0
- Balans+(azul claro) - o resultado financeiro que levou ao lucro em comparação com todos os lucros e perdas, este valor é escalonado para caber no gráfico
- Balans-(tijolo) - resultado financeiro que levou à perda em relação a todos os lucros e perdas, este valor é escalonado para caber no gráfico
- Círculos - este é o valor do balanço escalonado - focalizamos um valor zero a partir do valor zero da coordenada x - feito para ilustração
Linha aquática vertical - valor máximo Alvo=0
Linha vertical magnética - valor máximo Alvo=1
Linha vertical em vermelho - divisão condicional de 0,5 para classificação a 1 e padrão 0 em CatBoost - para maior clareza.
Presumo que quanto mais afastadas estiverem as linhas aquáticas e magnéticas da linha vertical vermelha, mais confiante estará o modelo em separar as classes. Também vale a pena observar linhas de equilíbrio, durante o treinamento elas também são espaçadas de ambos os lados - é especialmente relevante para modelos onde o lucro e a perda podem ter valores diferentes, assim, por exemplo, um modelo pode filtrar bem pequenas perdas, mas perder em grandes perdas, embora de acordo com o valor de precisão de classificação será superior a 0,5.
Além disso, analisamos a amostra de teste
Podemos ver que as linhas verticais - vermelho e magnetita - se aproximaram, mas sua posição relativa não mudou, o que já é bom (acontece que a magnetita está na zona de <0,5). As linhas de equilíbrio se aproximaram, o que é decepcionante. Existe uma área de perda após a probabilidade de 0,5, o que sugere que o modelo é de qualidade insuficiente.
Além disso, podemos ver os resultados na amostra de teste.
No lado direito (probabilidade acima de 0,5) a situação parece melhor do que na amostra de teste, pode indicar que a amostra de teste é uma ocorrência rara e houve poucos exemplos semelhantes a ela em treinamento, ou o modelo não está totalmente treinado. A favor deste último pressuposto está o facto de existirem regiões onde a linha de balançoBalans+, indicando resultados financeiros positivos, intersecta a linhaBalans-, o que também pode ser visto quando se olha para círculos que indicam o delta entre o lucro e a perda numa determinada zona de probabilidade, nazona de probabilidade inferior a 0,5.
Bem, vamos ver o saldo da amostra de exame.
Você pode ver claramente que o caráter do mercado mudou, o que pode ser visto em 2/3 do gráfico - devemos continuar a estudar o modelo.
E aqui está um exemplo de um modelo claramente mau.
Já na amostra de teste pode-se ver um forte deslocamento de todo o corpo para a parte esquerda, ou seja, o modelo sabe muito pouco sobre a amostra - a completude é baixa, e o pico da acumulação do alvo 1 está atrás da parte esquerda da probabilidade. Vale a pena notar que ainda há um ganho na aprendizagem.
Vamos olhar para a amostra de teste e exame
Já na amostra de teste podemos ver que todas as linhas fora de probabilidade 0,5 estão muito próximas, e na amostra de teste podemos ver como as linhas de equilíbrio têm trocado de lugar.
Essencialmente tenho uma rede vazia (só a treino para que possa ser inicializada porque não é auto-escrita, mas sim a partir de um pacote)
Eu posso pensar em qualquer abstracção, qualquer alvo e escrever uma função de fitness.
Então deixe a genética começar a mudar os pesos da rede para que eu (rede) receba pelo menos algo semelhante ao meu objetivo no teste e no trem.
E isso é mil vezes" mais profundo do que criar as etiquetas e encaixar a regressão ou classificação.
você recuou 2 anos quando estávamos a condenar o treino de neurónios com o optimizador mt5.
E eu estava a escrever tais bots. É uma optimização comum com uma série de parâmetros.
Vê isto.
https://www.mql5.com/ru/articles/497
você recuou 2 anos quando houve a condenação do treino de neurónios através do optimizador mt5
E eu estava a escrever tais bots. Esta é uma optimização comum com muitos parâmetros.
Continua a ler.
https://www.mql5.com/ru/articles/497
Eu tentei com o máximo lucro, eu posso treiná-lo com outra coisa
Ouve, se não és muito preguiçoso, tenta treinar o catbust no lucro máximo, não tenho a certeza de como funciona lá.
você tem que alimentar o X - dados e o Y - alvo ao mesmo tempo
talvez toda essa "personalização" seja apenas uma modificação cosmética das funções existentes
Voltar à questão da visualização do modelo CatBoost, a fim de analisar a sua perspectiva.
Acho que grandes estudos como este deveriam ser blogados e copiados aqui. Não vais conseguir encontrá-lo aqui em seis meses...
Talvez - eu simplesmente não uso um blog, por isso não me ocorreu.
Estou pensando que posso colocar todos esses pontos do gráfico (20 por curva) em uma amostra e tentar aprender - talvez dessa forma possamos nos identificar com um modelo de maior probabilidade com estabilidade potencial.
Talvez - eu só não uso o blog, então isso não me ocorreu.
Estou pensando que posso colocar todos esses pontos do gráfico (20 por curva) em uma amostra e tentar aprender - talvez assim possamos nos identificar com um modelo de maior probabilidade com estabilidade potencial.
Qual será o alvo? Como marcar cada um dos exemplos? Ou por auto-aprendizagem?
O alvo seria o resultado financeiro do modelo na amostra de exame.
Só estou a tentar lucrar ao máximo, podia treinar para outra coisa.
Ouve, se não és muito preguiçoso, tenta treinar o katbust com o máximo lucro, não tenho a certeza se funciona lá.
você tem que alimentar o X - dados e o Y - alvo ao mesmo tempo
talvez toda essa "customização" seja apenas uma mudança cosmética nas funções existentes
demasiado preguiçoso para escrever novas métricas... e definitivamente não será lucro máximo, mas algo mais significativo
e.g. estabilidade de Lyapunov ))
demasiado preguiçoso para escrever novas métricas ainda... e definitivamente não será o lucro máximo então, mas algo mais significativo
como a estabilidade de Lyapunov ))))
Você não precisa de um campo de nível, ou densidade)))). No nosso negócio é raro.
Voltando à questão da visualização do modelo CatBoost, a fim de analisar a sua perspectiva.
Sim, as distribuições normalmente mostram tudo. Você pode apenas fazer estes para os sinais... não há reforços e imediatamente ver