Aprendizado de máquina no trading: teoria, prática, negociação e não só

Aleksey Vyazmikin 2020.12.03 15:04 #22141

Voltando à questão da visualização do modelo CatBoost, a fim de analisar a sua perspectiva.

Este é o aspecto do modelo na amostra de treino:

O eixo x é o valor de probabilidade da função logística, e o eixo y é a porcentagem sobre um intervalo de 0,05 valores:

- Razdel(azul) - todos os valores da amostra.

- Target=1(íman) - valores do target 1

- Target=0(aqua) - valores alvo 0

- Balans+(azul claro) - o resultado financeiro que levou ao lucro em comparação com todos os lucros e perdas, este valor é escalonado para caber no gráfico

- Balans-(tijolo) - resultado financeiro que levou à perda em relação a todos os lucros e perdas, este valor é escalonado para caber no gráfico

- Círculos - este é o valor do balanço escalonado - focalizamos um valor zero a partir do valor zero da coordenada x - feito para ilustração

Linha aquática vertical - valor máximo Alvo=0

Linha vertical magnética - valor máximo Alvo=1

Linha vertical em vermelho - divisão condicional de 0,5 para classificação a 1 e padrão 0 em CatBoost - para maior clareza.

Presumo que quanto mais afastadas estiverem as linhas aquáticas e magnéticas da linha vertical vermelha, mais confiante estará o modelo em separar as classes. Também vale a pena observar linhas de equilíbrio, durante o treinamento elas também são espaçadas de ambos os lados - é especialmente relevante para modelos onde o lucro e a perda podem ter valores diferentes, assim, por exemplo, um modelo pode filtrar bem pequenas perdas, mas perder em grandes perdas, embora de acordo com o valor de precisão de classificação será superior a 0,5.

Além disso, analisamos a amostra de teste

Podemos ver que as linhas verticais - vermelho e magnetita - se aproximaram, mas sua posição relativa não mudou, o que já é bom (acontece que a magnetita está na zona de <0,5). As linhas de equilíbrio se aproximaram, o que é decepcionante. Existe uma área de perda após a probabilidade de 0,5, o que sugere que o modelo é de qualidade insuficiente.

Além disso, podemos ver os resultados na amostra de teste.

No lado direito (probabilidade acima de 0,5) a situação parece melhor do que na amostra de teste, pode indicar que a amostra de teste é uma ocorrência rara e houve poucos exemplos semelhantes a ela em treinamento, ou o modelo não está totalmente treinado. A favor deste último pressuposto está o facto de existirem regiões onde a linha de balançoBalans+, indicando resultados financeiros positivos, intersecta a linhaBalans-, o que também pode ser visto quando se olha para círculos que indicam o delta entre o lucro e a perda numa determinada zona de probabilidade, nazona de probabilidade inferior a 0,5.

Bem, vamos ver o saldo da amostra de exame.

Você pode ver claramente que o caráter do mercado mudou, o que pode ser visto em 2/3 do gráfico - devemos continuar a estudar o modelo.

E aqui está um exemplo de um modelo claramente mau.

Já na amostra de teste pode-se ver um forte deslocamento de todo o corpo para a parte esquerda, ou seja, o modelo sabe muito pouco sobre a amostra - a completude é baixa, e o pico da acumulação do alvo 1 está atrás da parte esquerda da probabilidade. Vale a pena notar que ainda há um ganho na aprendizagem.

Vamos olhar para a amostra de teste e exame

Já na amostra de teste podemos ver que todas as linhas fora de probabilidade 0,5 estão muito próximas, e na amostra de teste podemos ver como as linhas de equilíbrio têm trocado de lugar.

Algoritmo para combinar faixas Estatísticas de um sistema Existe um padrão para

[Excluído] 2020.12.03 15:07 #22142

mytarmailS:

Essencialmente tenho uma rede vazia (só a treino para que possa ser inicializada porque não é auto-escrita, mas sim a partir de um pacote)

Eu posso pensar em qualquer abstracção, qualquer alvo e escrever uma função de fitness.

Então deixe a genética começar a mudar os pesos da rede para que eu (rede) receba pelo menos algo semelhante ao meu objetivo no teste e no trem.

E isso é mil vezes" mais profundo do que criar as etiquetas e encaixar a regressão ou classificação.

você recuou 2 anos quando estávamos a condenar o treino de neurónios com o optimizador mt5.

E eu estava a escrever tais bots. É uma optimização comum com uma série de parâmetros.

Vê isto.

https://www.mql5.com/ru/articles/497

Нейронные сети - от теории к практике

www.mql5.com

В наше время, наверное, каждый трейдер слышал о нейронных сетях и знает, как это круто. В представлении большинства те, которые в них разбираются, это какие-то чуть ли не сверхчеловеки. В этой статье я постараюсь рассказать, как устроена нейросеть, что с ней можно делать и покажу практические примеры её использования. Понятие о нейронных сетях...

mytarmailS 2020.12.03 15:36 #22143

Maxim Dmitrievsky:

você recuou 2 anos quando houve a condenação do treino de neurónios através do optimizador mt5

E eu estava a escrever tais bots. Esta é uma optimização comum com muitos parâmetros.

Continua a ler.

https://www.mql5.com/ru/articles/497

Eu tentei com o máximo lucro, eu posso treiná-lo com outra coisa

Ouve, se não és muito preguiçoso, tenta treinar o catbust no lucro máximo, não tenho a certeza de como funciona lá.

você tem que alimentar o X - dados e o Y - alvo ao mesmo tempo

talvez toda essa "personalização" seja apenas uma modificação cosmética das funções existentes

Por favor, me oriente Quaisquer perguntas de recém-chegados Volumes, volatilidade e índice

Aleksei Kuznetsov 2020.12.03 15:53 #22144

Aleksey Vyazmikin:

Voltar à questão da visualização do modelo CatBoost, a fim de analisar a sua perspectiva.

Acho que é melhor publicar uma pesquisa tão grande num blogue e uma cópia aqui. Seis meses depois não o vais encontrar aqui...

Aleksey Vyazmikin 2020.12.03 17:02 #22145

elibrarius:
Acho que grandes estudos como este deveriam ser blogados e copiados aqui. Não vais conseguir encontrá-lo aqui em seis meses...

Talvez - eu simplesmente não uso um blog, por isso não me ocorreu.

Estou pensando que posso colocar todos esses pontos do gráfico (20 por curva) em uma amostra e tentar aprender - talvez dessa forma possamos nos identificar com um modelo de maior probabilidade com estabilidade potencial.

[Arquivo!] Qualquer pergunta de Sua opinião queria proteção de descompilação

Aleksei Kuznetsov 2020.12.03 17:22 #22146

Aleksey Vyazmikin:

Talvez - eu só não uso o blog, então isso não me ocorreu.

Estou pensando que posso colocar todos esses pontos do gráfico (20 por curva) em uma amostra e tentar aprender - talvez assim possamos nos identificar com um modelo de maior probabilidade com estabilidade potencial.

Qual é o alvo? Como marcar cada exemplo? Ou por auto-aprendizagem?

Aleksey Vyazmikin 2020.12.03 17:44 #22147

elibrarius:
Qual será o alvo? Como marcar cada um dos exemplos? Ou por auto-aprendizagem?

O alvo seria o resultado financeiro do modelo na amostra de exame.

[Excluído] 2020.12.03 18:44 #22148

mytarmailS:

Só estou a tentar lucrar ao máximo, podia treinar para outra coisa.

Ouve, se não és muito preguiçoso, tenta treinar o katbust com o máximo lucro, não tenho a certeza se funciona lá.

você tem que alimentar o X - dados e o Y - alvo ao mesmo tempo

talvez toda essa "customização" seja apenas uma mudança cosmética nas funções existentes

demasiado preguiçoso para escrever novas métricas... e definitivamente não será lucro máximo, mas algo mais significativo

e.g. estabilidade de Lyapunov ))

Valeriy Yastremskiy 2020.12.03 19:02 #22149

Maxim Dmitrievsky:

demasiado preguiçoso para escrever novas métricas ainda... e definitivamente não será o lucro máximo então, mas algo mais significativo

como a estabilidade de Lyapunov ))))

Você não precisa de um campo de nível, ou densidade)))). No nosso negócio é raro.

[Excluído] 2020.12.03 19:05 #22150

Aleksey Vyazmikin:

Voltando à questão da visualização do modelo CatBoost, a fim de analisar a sua perspectiva.

Sim, as distribuições normalmente mostram tudo. Você pode apenas fazer estes para os sinais... não há reforços e imediatamente ver

Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2215