Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 890

 
Aleksey Vyazmikin:

Aqui está o primeiro tema de teste pronto - treinamento 2015-2016, e a partir de 2017 o puro comércio sobre as regras das árvores selecionadas - não perdeu - já é bom?

Contra negociação sem NS - treino (ugh - afinação e optimização) 2016-2017


Ainda não percebo a melhor maneira de o fazer - acabei por seleccionar regras e transformá-las em código - um trabalho manual muito meticuloso... Precisa de algum tipo de automatização do processo.


O erro dos seus 10% em treinamento tornou-se imediatamente 50% no futuro.

Isto é sobre-aprendizagem ou espreitar o futuro pelos preditores.
 
Maxim Dmitrievsky:

você já o tem funcionando sem uma árvore ) tente adicionar o otimizador do meu artigo sobre a floresta, talvez os resultados melhorem

Tente usar informações mútuas para determinar a importância.

Já procurei em dois artigos, não entendo o que você quer dizer com otimizador para andaimes?

Quero saber mais sobre a importância, que tipo de informação mútua - entre a rede e a EA sem a rede ou entre os sinais de compra e venda? Eu preciso do código, mas não tenho a certeza.

 
elibrarius:

O erro dos seus 10% no treino tornou-se imediatamente 50% no futuro.

Isto é ou sobre-aprendizagem ou espreitar os prognósticos para o futuro.

Na verdade não, só escolhi 25 regras para comprar e 16 regras para vender, o que provavelmente é menos de 0,1% de todas as regras. Eu estava escrevendo acima que o problema é que, na minha opinião, existem muitas regras, o que não é eficiente.

O peeping não está lá (na lógica não, bem se erro no código, mas dois códigos são usados - um para tomar informações no script, outro para trabalhar por regras como um indicador, ou seja, a probabilidade de erro é menor).

Re-aprendizagem - sim, talvez sim, em geral, se globalmente, as minhas ficções são da área "siga a tendência", feitas para encontrar tendências, e 2017 em Si foi quase de um único apartamento, sem tendências globais - mercado um pouco diferente.

Por outro lado, recolho fichas de diferentes TFs, recebo uma classificação de mais a menos, e parece uma pirâmide invertida, ou zoom, ou seja, divido condicionalmente um mês em duas partes com subconjuntos, olho para a mesma semana, dia, hora em cada subconjunto... e assim recolheu estatísticas que, com outras ficções, se revelaram repetíveis na amostra.

Regras de compra


Azul - este é o preço no canal Donchian no momento da decisão - de 0 - 10 - 10% passo - uma compra é sugerida quando o preço sobe, o que é razoável em geral.

Verde - apenas uma grande escala da área ATR planejada dia, semana, mês - ou seja, uma grande tendência, há uma quebra de -8 nível para +8 nível, por exemplo, pode ser visto que no sobre-vendido no TF mensal - nível -6 - apenas 1 regra para compra, enquanto o crescimento é sugerido a partir de -3, -1, -2, -4 nível - ou sejaou seja, provavelmente com muita ênfase no facto de os futuros USD/RUB estarem na sua maioria a subir mais do que a descer numa base mensal, e houve inversões dentro da barra (inversão do preço de abertura após uma forte mudança para um dos lados).

Grey(?) - RSI na hora - é recomendada a compra fora dos 70 níveis (apenas 1 vez é recomendada a compra fora dos 70 níveis).

Laranja (de acordo com o escritório) - BB_Up - é preço acima do limite superior do Bollinger na abertura de um novo bar - 6 em cada 25 preferem o overbought no momento, como sinal de entrada, mas os outros 19 preferem sem oversold, e a julgar pelo BB_Down - calmo - prateleira ou plano.

Amarelo - TimeH - há preferência para entrar às 10 horas (4 de 13) - ou seja, imediatamente na abertura e no fechamento - às 23 horas (2 de 13), e não é surpreendente, pois às 10 horas é fornecido movimento brusco e forte, o resto 12,15,13,17 - sessão diária normal com boa volatilidade, mas as 20 horas é uma exceção à regra. Talvez, se adicionarmos dias da semana, haverá algumas regularidades, ligadas às notícias semanais - as reservas de petróleo e suas previsões são reais para o rublo - eu vou tentar.

 

Queria manter o meu almoço de silêncio até obter algumas boas estatísticas, mas não posso vê-lo persistentemente errar....

Qualquer conversão leva a uma redução na informação sobre a série que está sendo procurada. Mesmo Mashka com o parâmetro 2 começa a atrasar e perde uma pequena quantidade de informação de kotir no processo. NS é uma ferramenta tão delicada trabalhando com números reais, onde qualquer dígito, mesmo com 10 casas decimais, pode ser decisivo na solução final. Você corta a parte real do número ao categorizar suas entradas de -1 a 30 (como exemplo), e você obtém 31 categorias. No mundo real, o número de escolhas entre -1 e 30 é exatamente tantas ordens de grandeza quanto você toma essas ordens de grandeza após o ponto decimal. Como resultado, se você tomar int, você tem 31 opções para dividir, e se você tomar doble, há consideravelmente mais opções para dividir.

Se você usar o input categórico de -1 a 30, a qualidade dos dados em si deve ser muito alta para que a rede possa aprender com eles e obter um bom resultado, mas como TODOS os seus dados são construídos a partir do preço a sua qualidade é muito questionável, e você também corta os números reais nos mesmos, matando assim a capacidade de NS de pegar em qualquer coisa.

As categorias podem ser utilizadas na entrada se a qualidade dos dados utilizados já for suficientemente elevada. O que basicamente invalida o uso de NS em princípio. Com bons preditores categóricos você pode construir um TS sem NS....

Bem, é tão.... a pensar em voz alta... sangra-me o coração olhar para as tuas parvoíces... Até quebrou o almoço de silêncio.....

 

Se estamos comparando um lago com outro, a métrica realmente importa assim tanto? Não, claro, se não estamos a comparar um lago com um lago, a resposta pode ser diferente - um lago ou uma poça, mas devemos ter medo de molhar os pés numa poça no caminho para o lago? Pessoalmente, eu não vejo o ponto em categorias precisas, talvez seja importante para aquele NS que pode analisar informações para cima e para baixo, mas eu não tenho uma, e para uma árvore é mais do que suficiente, como eu vejo agora.

 
Aleksey Vyazmikin:

Se estamos comparando um lago com outro, a métrica realmente importa assim tanto? Não, claro, se não estamos a comparar um lago com um lago, a resposta pode ser diferente - um lago ou uma poça, mas devemos ter medo de molhar os pés numa poça no caminho para o lago? Pessoalmente, eu não vejo o ponto em categorias precisas, talvez seja importante para aquele NS que é capaz de analisar informações para cima e para baixo, mas eu não tenho uma, e para uma árvore é mais do que suficiente, como eu vejo agora.

Para utilizar entradas categóricas. A qualidade de tais insumos deve ser muito boa. Se a qualidade dos inputs é pobre, é melhor não convertê-los em categorias, mas alimentar os valores reais dos próprios indicadores. Então NS terá mais opções para dividir esta área adequadamente IMHO!

 

OK, quero dar um agradecimento especial à FOCUSNIC!!!!!

Não pensei que chegasse a isto, mas o seu conselho acabou por ser fundamental na preparação dos prognosticadores. Então parabéns para ti, cabra. seu filho da puta!!!! (sem ofensa)

Vou postar um vídeo mais tarde que definitivamente mencionará você nele... Então espere pelo vídeo de Michael :-) onde eu vou contar sobre o meu entendimento do campo de Mo em geral. Acho que este vídeo será interessante não só para iniciantes, mas também para experientes .... por isso...espera por isso!!!!

 
Mihail Marchukajtes:

Para utilizar entradas categóricas. A qualidade destes insumos deve ser muito boa. Se a qualidade dos inputs é fraca, é melhor não traduzi-los em categorias, mas alimentar os valores reais dos próprios indicadores. Desta forma os NS terão mais opções para dividir esta área adequadamente IMHO!!!

Em que você se propõe medir a qualidade?

 
Mihail Marchukajtes:

Para utilizar entradas categóricas. A qualidade destes insumos deve ser muito boa. Se a qualidade dos inputs é fraca, é melhor não traduzi-los em categorias, mas alimentar os valores reais dos próprios indicadores. Desta forma os NS terão mais opções para dividir esta área adequadamente IMHO!!!

31 categoria... não, é mais como uma discretização com 31 passos. Um dos artigos do Vladimir usa-o e o resultado não é pior.
 
Aleksey Vyazmikin:

Qual é a medida de qualidade proposta?

Primeiro, grave o momento em que a decisão é tomada. Que seja um evento. Então, exatamente neste momento em que o evento ocorreu, salve os valores dos indicadores.

Para ser honesto, não entendo bem a sua mesa. O que tem lá dentro?

Razão: