Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 1033

 
Roffild:

Eu sou um programador, não um telepata. Qualquer pergunta, eu dou-lhe as respostas...

Resposta: 42 :D

Se você está pronto para responder como programador, aqui vai uma pergunta rápida - uma tarefa de programação, ao mesmo tempo em que verifica os skils em que você insiste.

No ficheiro anexo existe um modelo de sinais EURUSD H1 para uma EA, precisamos de determinar o algoritmo da sua formação.

Se você quiser você pode publicar a solução como um EA e mostrar em ação o poder do preditor bruteforcing e sua biblioteca de aprendizagem da máquina.

Sugiro a todos os operadores interessados que se juntem a mim, também estou pronto para resolver o problema proposto ou quaisquer outros apresentados como modelos usando o meu MO.

Talvez neste modo de scribing possamos trabalhar pelo menos algumas abordagens e formatos comuns)).

Arquivos anexados:
EA_EURUSD_H1.tpl  130 kb
 

Todos os indicadores devem ter sido eliminados antes de gravar o modelo. Pode não ter sido o indicador name=main, mas os dados não são exibidos.

E onde está a garantia de que a estratégia é rentável? Talvez seja apenas um pedaço de história de sorte...

Ninguém parece ter lido a minha biblioteca, porque não há perguntas sobre isso especificamente. Todos querem o graal sem compreender os meios para o encontrar.

 
Roffild:

Todos os indicadores devem ter sido eliminados antes de gravar o modelo. Pode não ter sido o indicador name=main, mas os dados não são exibidos.

E onde está a garantia de que a estratégia é rentável? Talvez seja apenas um pedaço de história de sorte...

Parece que ninguém conheceu a minha biblioteca, porque não há perguntas sobre isso. Todos querem obter o graal, sem compreender os meios para o encontrar.

A entrada principal está em todos os templates, não interfere, e os dados lá são apenas objetos gráficos - setas, azul - COMPRAR, vermelho - VENDER.

Você abre o gráfico EURUSD H1 e faz o download do arquivo (menu Gráficos\Template\Load Template...) e verifica a Lista de Objetos no menu de contexto.


E ninguém lhe pede um graal, só para resolver o problema e confirmar na prática o que você diz e como funciona a biblioteca.

 
Aleksey Terentev:
Se você se interessa por arquiteturas avançadas de redes neurais, algumas idéias muito interessantes surgem. É claro que é difícil entrar em detalhes, você precisa de experiência com estruturas de dithering, e uma compreensão da matemática vetorial em geral.
Mas vale a pena.
Quanto ao mercado, eu não tenho muito para mostrar, o mercado é ***inok) Demora muito tempo.
Venha até nós na discórdia, temos um ambiente tranquilo e aconchegante) Vou descrever e mostrar-lhe por exemplos como preparar redes profundas.

Não lho dês, ele vai-te foder os miolos.

 
Aleksey Terentev:
Se você se interessa por arquiteturas avançadas de redes neurais, algumas idéias muito interessantes surgem. É claro que é difícil entrar em detalhes, você precisa de experiência com estruturas de dithering e compreensão da matemática vetorial em geral.
Mas vale a pena.
Quanto ao mercado, eu não tenho muito para mostrar, o mercado é ***inok) Demora muito tempo.
Venha até nós em discordância, temos um ambiente tranquilo e aconchegante) Vou descrever e mostrar-lhe por exemplos, como preparar uma rede profunda.

Eu comunico no fórum e não apoio seitas

)

 
Roffild:

Eu sou um programador, não um telepata. Se tiver alguma pergunta, eu dou-lhe as respostas...

Resposta: 42 :D

Estou interessado no conceito de porque deve funcionar, não no que se liga a quê e com que rapidez

explicação teórica da abordagem, não me apercebi do código e não é divertido usar java e faísca, etc. só para o entender

isto é, como você vê e trabalha com iO, a profundidade da sua compreensão, por assim dizer.

se você responder 43 eu não vou perguntar novamente :)

 

Parte da minha biblioteca, que está em MQL5, não está diretamente ligada ao Apache Spark. Há um módulo separado em Java que converte dados para uso em Spark. E este módulo deve ser portado para Python.

Apache Spark é um grande sistema distribuído de processamento de dados + módulo para Florestas Aleatórias. Pode processar dados em 1000 servidores (o Facebook tropeçou em tal limite).

Grandes dados - quando o processamento de arquivos não cabe na RAM.

Dado: 800 preditores ao longo de 2 anos em 5 GB.

Tarefa: Use alguns servidores amazônicos baratos para criar 250 árvores em 1-2 horas.

Solução: AWS EMR + Apache Spark.

Existe uma opção para resolver este problema sem usar a Spark?

 

Apache Spark deixa-o esquecer a falta de RAM.

Criei uma Floresta Aleatória de 500 árvores com 7000 preditores e 30GB de dados. A Amazon funcionou durante 15 horas em dois servidores com 16 CPUs.

 
Roffild:

Apache Spark permite que você esqueça a falta de RAM.

Criei a Random Forest de 500 árvores com 7000 preditores e 30 GB de dados. A Amazon estava funcionando 15 horas em dois servidores com 16 CPUs.

E o ponto de 7000 preditores em uma floresta aleatória? Ainda está a reeducar-se. Levou cerca de 30-40 preditores e treinou a floresta. Depois verifiquei cada um deles um a um e seleccionei 4 preditores desta forma.

A floresta que foi treinada em quatro preditores revela-se um pouco melhor do que com 30-40, mas não por muito. As cotações em particular têm um tipo de dados mais aleatórios e acaba por ser +5% (predizem corretamente 55%) para a classe desejada em relação à classe negativa.

Talvez, é claro, possamos de alguma forma extrair um componente da série de preços que dividirá melhor as classes, mas até agora ainda não consegui fazê-lo.

O meu ponto é que não há necessidade de criar preditores. Acho que não vai fazer muito sentido, só vai fazer a floresta se reeducar ainda mais rápido.

 
Roffild:

Apache Spark deixa-o esquecer a falta de RAM.

Criei uma Floresta Aleatória de 500 árvores com 7000 preditores e 30GB de dados. A Amazon funcionou durante 15 horas em dois servidores com 16 CPUs.

Decidiram enfiar-se no inapto e multiplicar os preditores sem qualquer sentido.

de onde você tirou tantos preditores? qual é a importância deles? há 1/3 da floresta não incluída no conjunto de treinamento e 95% têm baixa importância. E qual é a resposta do sistema agora com tantos preditores, 3 horas para 1 previsão? )