Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 3083

 
Maxim Dmitrievsky #:

Para transformar parâmetros incômodos em funções, você pode usar os valores de saída do RF ou de qualquer algoritmo básico, como no artigo. Para os completamente desinformados: substitua os valores dos parâmetros selecionados por valores de função. Então, a regressão linear (ou qualquer outro algoritmo) será o meta lerner por meio do qual o efeito do tratamento é avaliado. Por que e como tudo isso funciona - aprenda a matemática.

Para entendê-la, basta começar a pensar com sua cabeça. Mas Sanych começará a fazer bobagens novamente, porque ele só quer dizer algo sem pensar. Sanych, sua falta de compreensão é tão grande que você cita os parâmetros de RF como algum tipo de prova, o que é absolutamente inacreditável. Já lhe escrevi três vezes: esqueça a RF. Pela última vez: estude o assunto e depois discurse. Caso contrário, as mesmas pessoas não instruídas acreditarão cegamente em você.

E não responda às minhas postagens com a desenvoltura de um sabe-tudo (o que é irritante), porque você não sabe nada, e isso parece o delírio de um ptuschnik.

Todas as referências a fontes são fornecidas no artigo. Vocês precisam ser cutucados a cada palavra como gatinhos cegos? Ou, afinal, vocês são adultos?

Eu estava discutindo o artigo, não seu número no bolso, que, acredito, é muito grande de acordo com a lista de literatura a que você se refere.

Se você tem um desejo tão ardente de continuar a discussão sobre o artigo que postou, estou pronto para continuar, mas: apenas o artigo e apenas meus argumentos, e de uma forma que exclua a grosseria proibitiva de sua parte.


O artigo discutiu a RF. Não vi nenhuma outra função que calculasse o erro de ajuste, bem como o próprio ajuste. Portanto, tenha a gentileza de pegar o texto do artigo e fornecer uma citação específica que refute essa ideia.

 
Lilita Bogachkova #:

Tenho uma pergunta para os especialistas em aprendizado de máquina. Se eu usar os dados de um personagem para treinamento, os dados de outro personagem para validação e os dados de um terceiro personagem para teste, essa é uma boa prática?

Além disso, obtenho os seguintes resultados dos dados de teste: as células verdes são muito boas, as amarelas são boas e as vermelhas são médias.


E também uma pergunta sobre a modificação dos dados para treinar o modelo. Notei que o modelo tem dificuldade para encontrar extremos, no meu caso, valores acima de 60 e valores abaixo de 40.
Assim, encontro valores acima de 60 e abaixo de 40 nos dados de treinamento, que adicionalmente adiciono novamente aos dados de treinamento antes de inseri-los no modelo, portanto, a pergunta é: posso melhorar a precisão do modelo aumentando os dados de treinamento que contêm informações sobre extremos?

Se você não consegue perceber a diferença entre os instrumentos, você pode. Ou forçá-los a chegar a esse estado, subtraindo a diferença.

Quanto à segunda pergunta, provavelmente não é possível. Ele estará mais errado em outros lugares, porque puxará o gradiente para si mesmo. Mas tudo isso é individual.
 
Maxim Dmitrievsky #:
Se você não consegue perceber a diferença entre os instrumentos, você pode. Ou forçá-los a esse estado subtraindo a diferença.

Quanto à segunda pergunta, não, provavelmente não é possível. Ele estará mais errado em outros lugares, porque puxará o gradiente para si mesmo.

No momento, parece que é isso mesmo.


No entanto, antes de desistir dessa ideia, verei o que consigo com o treinamento do modelo, misturando diferentes instrumentos (símbolos) e, em seguida, criando dados contendo apenas valores extremos.

 
Lilita Bogachkova #:

Aessa altura, realmente se parece com isso.


No entanto, antes de desistir dessa ideia, verei o que consigo com o treinamento do modelo misturando diferentes instrumentos (caracteres) e, em seguida, criando dados contendo apenas valores extremos.

Experimente, bem. Não vi nenhuma diferença entre um e mais de um.
 
Maxim Dmitrievsky #:
Se você não consegue perceber a diferença entre os instrumentos, você pode. Ou forçá-los a esse estado subtraindo a diferença.

Atualmente, a prática com símbolos diferentes para treinamento, validação e teste permite que você aumente a precisão da previsão. Como vantagem dessa prática, posso mencionar que não há limite para o tamanho dos dados, você pode fornecer o quanto quiser ou precisar para validação ou treinamento.

Ao testar com um terceiro símbolo, você pode ver imediatamente se o modelo é capaz de encontrar padrões universais, em vez de ficar preso a eventos de mercado restritos específicos de um determinado símbolo.

 
Lilita Bogachkova #:

Atualmente, a prática com símbolos diferentes para treinamento, validação e teste permite que você aumente a precisão da previsão. Como vantagem dessa prática, posso mencionar que não há limite para o tamanho dos dados, você pode fornecer o quanto quiser ou precisar para validação ou treinamento.

Ao testar com o terceiro símbolo, você pode ver imediatamente se o modelo é capaz de encontrar padrões universais em vez de ser orientado por eventos de mercado restritos.

Se não houver um grande viés nos dados. Símbolos diferentes têm dispersão diferente de sinais, e o modelo pode se desviar deles ou ficar em uma única posição. Se os sinais pelo menos não mudarem suas propriedades de símbolo para símbolo, isso é possível.
 
Gostaria de ouvir opiniões sobre a correção de dados de treinamento removendo valores que se repetem várias vezes em uma linha, como valores que se repetem mais de 4 vezes em uma linha.
seq = remove_repeating_values(seq, 5)
Pelo que entendi, esses valores iguais tendem a chegar a várias dezenas no caso de um mercado plano. O que, em minha opinião, prejudica o treinamento do modelo.
 
Lilita Bogachkova #:
Gostaria de ouvir opiniões sobre a correção dos dados de treinamento removendo valores que se repetem várias vezes em uma linha, como valores que se repetem mais de 4 vezes em uma linha.
Pelo que sei, esses valores iguais tendem a chegar a várias dezenas no caso de um mercado estável. O que, na minha opinião, dificulta o treinamento do modelo.
Normalmente, os modelos extraem valores aleatoriamente, não em uma linha. E misturar a amostra é um sinal de bom senso :) O lstm pode ser descartado e as amostras podem ser misturadas.
 
Maxim Dmitrievsky #:
Normalmente, os modelos randomizam os valores, não em uma linha.

Sim,

X_train, X_val, y_train, y_val = train_test_split(inputs_unique, outputs_unique, test_size=test_size_value,
                                                    random_state=random_state_value)

mas o grande número com os mesmos valores me faz questionar a qualidade geral dos dados.
Exemplo: seq = ([5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5]) = [5,5,5,5,5,5,5,5,5][5]; [5,5,5,5,5,5,5,5,5,5][5]; [5,5,5,5,5,5,5,5,5][5] ....
Não vejo sentido em alimentar o modelo com esses dados de treinamento;

Portanto, ainda estou filtrando todos os dados que não são exclusivos.

inputs_unique, indices = np.unique(inputs, axis=0, return_index=True)
outputs_unique = outputs[indices]

Posso estar errado, mas me parece errado também alimentar o modelo com os seguintes dados de treinamento:

[1,2,3,4,5] [5];

[1,2,3,4,5] [6];

[1,2,3,4,5] [7];

[1,2,3,4,5] [8];

...

 

Olá a todos. Estou tentando treinar Expert Advisors retirados de uma grande série de artigos sobre redes neurais neste site. Tenho a impressão de que eles não são treináveis. Tentei fazer perguntas ao autor nos artigos, mas infelizmente ele não as responde de forma prática...(

Portanto, uma pergunta aos membros do fórum: por favor, diga-me quanto devo treinar uma rede neural para que ela comece a dar algum resultado (não aleatório)?

Tentei todos os EAs, desde o artigo 27 até o último, e o resultado é o mesmo: aleatório. Passei de 300 para 1000 épocas de treinamento, conforme indicado pelo autor. Se o Expert Advisor estiver apenas com iterações, fiz de 100.000 a 20.000.000 iterações e assim por diante, 2-3 abordagens, ainda aleatórias.

Quanto deve ser treinado? Qual é o tamanho de uma amostra de treinamento suficiente (se ela for pré-criada)?

PS: Informações simples sobre redes neurais no google read, em geral as redes neurais são familiares. Todos escrevem cerca de 100-200 épocas e já deve haver um resultado (em fotos, figuras, classificações).

Razão: