Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 1638

 
elibrarius:
Uma explicação demasiado curta.
Não está claro se 1 preditor está lá fora dividido em vários e alimentado já como 5 preditores. Em vez disso, ainda é feito internamente como valores de divisão pré-calculados. E eles dividem-se por sectores.
Concordo que isto é mais eficiente do que a meia divisão no algoritmo clássico da árvore.

O que queres dizer fora ou dentro? Pelo que entendi, eles pegam um preditor e tentam dividir seus indicadores em segmentos para preservar um número suficiente de ativações e para dar a cada segmento algum poder de previsão, métodos diferentes são usados para isso - com um determinado passo ou com uma união linear de pequenos passos (para simplificá-lo), você obtém essas células com intervalos. Ao construir todas as árvores em treinamento, apenas conjuntos de tais células são usados. Mas, não é exacto :)

Eu, por outro lado, estou a tentar combinar estas células numa só. Ao ver este post ontem, há uma menção de que eles fazem algo semelhante para os preditores categóricos.

No meu caso há um risco de sobretreinamento - vou verificar isso em uma amostra um pouco mais tarde quando os modelos estiverem prontos, vou fazer uma amostra para testá-la ao mesmo tempo.

 

É bastante desconcertante que o problema da não-estacionariedade seja quase completamente ignorado neste tópico. Por alguma razão, assume-se que os padrões encontrados no passado funcionarão no futuro, e se não funcionarem, então ocorreu o excesso de aprendizagem. Mas, é bem possível que alguns padrões simplesmente parem de funcionar com o tempo - gradualmente ou até mesmo por saltos e limites (por exemplo, como resultado de uma crise como a atual).

O problema que eu vejo é que os padrões IO são complexos e mal interpretados pelos humanos. Se começarem a ter um mau desempenho, é impossível distinguir (dentro dos modelos) a variante de sobre-aprendizagem da variante de não-estacionariedade. Na análise convencional você pode sempre dizer: "mudança de tendência", "quebra de nível/canal", etc.

 
Aleksey Vyazmikin:

Com uma senhora assim, é provável que tenha de lavar a sua roupa e comer as suas refeições :)

Isso depende de como você a fritar. Uma mulher prensada cozinha melhor :-)
 
Mihail Marchukajtes:
Depende de como você a fritar. Uma mulher espremida cozinha melhor :-)

Não te vais safar com uma mulher assim, vais ter de aprender Matemática ao nível do MGO)

 
Aleksey Nikolayev:

É bastante desconcertante que o problema da não-estacionariedade seja quase completamente ignorado neste tópico. Por alguma razão, assume-se que os padrões encontrados no passado funcionarão no futuro, e se não funcionarem, então ocorreu o excesso de aprendizagem. Mas, é bem possível que alguns padrões simplesmente parem de funcionar com o tempo - gradualmente ou até mesmo por saltos e limites (por exemplo, como resultado de uma crise como a atual).

O problema que eu vejo é que os padrões IO são complexos e mal interpretados pelos humanos. Se começarem a ter um mau desempenho, é impossível distinguir (dentro dos modelos) a variante de sobre-aprendizagem da variante de não-estacionariedade. Na análise convencional, é sempre possível dizer: "mudança de tendência", "quebra de nível/canal", etc.

Eu não estou a adivinhar... A prática mostra um erro de 1% na trama de treinamento e 50% na nova trama. Ou seja, você precisa de preditores significativos, e pode até treinar com uma única árvore ou alguma regressão.

Uma árvore, a propósito, será muito fácil de interpretar.

 
Aleksey Nikolayev:

É bastante desconcertante que o problema da não-estacionariedade seja quase completamente ignorado neste tópico. Por alguma razão, assume-se que os padrões encontrados no passado funcionarão no futuro, e se não funcionarem, então ocorreu o excesso de aprendizagem. Mas, é bem possível que alguns padrões simplesmente parem de funcionar com o tempo - gradualmente ou até mesmo por saltos e limites (por exemplo, como resultado de uma crise como a atual).

O problema que eu vejo é que os padrões IO são complexos e mal interpretados pelos humanos. Se começarem a ter um mau desempenho, é impossível distinguir (dentro dos modelos) a variante de sobre-aprendizagem da variante de não-estacionariedade. Na análise convencional você pode sempre dizer: "mudança de tendência", "quebra de nível/canal", etc.

Eu concordo plenamente.

Tenho me questionado repetidamente sobre esta questão, e acho que é necessário comparar os resultados do sistema com o seu potencial em determinada área.

Eu estava pensando sobre isso hoje, como fazê-lo melhor e mais universalmente. Imagino que o processo de aprendizagem consista em várias etapas, a primeira das quais é a marcação de amostras, e você pode marcá-lo com base em algumas estratégias de sinal. Estas estratégias devem ser primitivas mas ter potencial, por exemplo, a travessia de MA pelo preço gera um sinal de entrada na direcção de tal travessia ou vice-versa. Então o treino é apenas uma forma de filtrar sinais falsos. Se tal hipótese for aceite, podemos calcular quanto em termos percentuais essa filtragem é eficaz em cada intervalo de tempo. O mais simples seria calcular a precisão e a exaustividade da classificação relativamente à estratégia básica. Existem outras opções - métricas. Então podemos ver como o desempenho do modelo muda, mesmo que ele comece a perder dinheiro.

 
Aleksey Nikolayev:

É bastante desconcertante que o problema da não-estacionariedade seja quase completamente ignorado neste tópico. Por alguma razão, assume-se que os padrões encontrados no passado funcionarão no futuro, e se não funcionarem, então ocorreu o excesso de aprendizagem. Mas, é bem possível que alguns padrões simplesmente parem de funcionar com o tempo - gradualmente ou até mesmo por saltos e limites (por exemplo, como resultado de uma crise como a atual).

O problema que eu vejo é que os padrões IO são complexos e mal interpretados pelos humanos. Se começarem a ter um mau desempenho, é impossível distinguir (dentro dos modelos) a variante de sobre-aprendizagem da variante de não-estacionariedade. Na análise convencional, é sempre possível dizer: "mudança de tendência", "quebra de nível/canal", etc.

Eu tenho treino. Não notei nenhuma mudança no espaço de um mês desde o último treino, mesmo depois de uma grande recuo do bitcoin. A única coisa que o afeta é o período logo após o movimento manipulativo do ativo, durante este tempo a rede neural está completamente perdida e fala bobagens, quanto mais longe de tal tempestade, mais adequados se tornam os prognósticos.
 
Evgeny Dyuka:
Há a prática. Em um mês desde o último treinamento não notei nenhuma mudança, mesmo depois que o bitcoin foi muito enxaguado. A única coisa que o afeta é o período logo após o movimento manipulado do ativo, durante esse período o neurônio é completamente perdido e exibe todo tipo de lixo; quanto mais longe de tal tempestade, mais adequadas se tornam as previsões.

- interessante de se ver... posso obter um link para ele (o canal) em uma mensagem privada?

- você foi capaz de criar um no final?

 
onedollarusd:

- interessante de se ver... posso obter um link para ele (o canal) em uma mensagem privada?

- você conseguiu criar um como resultado?

- não, utopia, muito tempo e esforço, eventualmente no backtest o bot compõe até X5 por ano em um par, mas em média 1 vez por ano tudo se escoa. No mercado real, esta "uma vez por ano" vai acontecer rapidamente, especialmente durante tempestades como agora. Eu não acredito mais em bots totalmente automatizados, simplesmente não pode funcionar, o mercado vai se ajustar e trapacear de qualquer forma)

- este correu melhor, agora temos um protótipo a funcionar.
Estimativas Neuro para o BTCUSD nos próximos 10-30 minutos, depende da "confiança" da rede. Quanto maior a confiança, maior é a probabilidade de se trabalhar em torno de 15 minutos, quanto menor a confiança, mais difusa é a previsão. Não há ligação para as velas, a previsão sai a cada minuto.

Se você baixar o Expert para MT5, você pode obtê-lo aqui (para aqueles que baixaram o Expert Advisor antes, você pode atualizá-lo usando este link, as correções de bugs estão disponíveis).
Funciona apenas no BTCUSD e apenas no M1, leia a instrução abaixo.

De acordo com esta visualização é claro que as previsões ainda não são ideais, mas o treinamento está apenas na fase inicial, tudo está de joelhos. Há um entendimento de para onde ir a seguir...

 
Elibrarius:
Eu não estou a assumir... A prática mostra 1% de erro na trama de treinamento e 50% de erro na nova trama. Isto é, precisamos de preditores significativos, e podemos treinar mesmo com uma única árvore ou alguma regressão.

Uma árvore, a propósito, seria muito fácil de interpretar.

Todos os preditores têm uma tendência para mudar o seu significado ao longo do tempo. Não se trata da sua inutilidade, mas da constante procura de novos e de estar preparado para a perda de significado dos que foram encontrados antes.

Razão: