O que alimentar a entrada da rede neural? Suas ideias... - página 75

 
Obrigado pelas explicações de todos!
 
Olá.

Vou colocar meus cinco centavos sobre o assunto.
Não julgue com rigor.

1. Use a metodologia de "ensino por exemplos".
O número de exemplos de treinamento deve ser limitado, não todo o histórico previsível.
Caso contrário, o "cérebro" da rede será uma bagunça, enquanto as respostas da rede treinada devem estar bem correlacionadas com as respostas corretas conhecidas, pelo menos para os exemplos com os quais ela foi treinada.
Na verdade, esse é o objetivo do treinamento de qualquer rede, quando estamos falando de treinamento em alguns dados obviamente disponíveis.

2. Os exemplos de treinamento são preparados a partir de um determinado número limitado de históricos h pelo método de "janela de rastreamento" com o tamanho de um determinado número de valores k.
Em outras palavras, o número de exemplos de treinamento (cada um de tamanho k) é igual a h, em que k e h são predefinidos.
Como o número de históricos de treinamento é limitado, quando um novo histórico aparece à direita e um histórico antigo desaparece à esquerda, o conteúdo do pacote de treinamento também muda, o que significa que a rede deve ser treinada novamente.
Dessa forma, a rede nunca se lembra do antigo demais e é regularmente retreinada com o novo.

3. Como regra geral, ao aprender com exemplos, cada exemplo de treinamento deve ser acompanhado de uma resposta correta conhecida.
No contexto de um sistema antípoda (compra ou venda), o valor da resposta correta conhecida deve estar entre -1 e +1.
Com um valor positivo da resposta, é fornecido um exemplo de aprendizado para compra e, com um valor negativo da resposta, é fornecido um exemplo de aprendizado para venda.
O que exatamente deve funcionar como uma resposta correta conhecida, especialmente no intervalo de -1 a +1, talvez eu não vá divulgar agora.
No entanto, repito que, após o treinamento, as respostas da rede devem se correlacionar bem com as respostas corretas conhecidas, pelo menos quando a rede é apresentada com os exemplos com os quais foi treinada.
Verificar a presença dessa correlação (teste de rede) é um procedimento obrigatório, caso contrário, é impossível afirmar que a rede aprendeu algo adequado e não ficou "chateada".

4. Como imagem de um exemplo de treinamento, podemos usar um determinado número de k valores de diferenças de preços de fechamento e abertura normalizados para o intervalo de -1 a +1, em relação ao máximo (módulo) desses k valores.
Esse exemplo de treinamento contém números positivos e negativos, que têm todo o direito de ter o sinal oposto ao de um exemplo semelhante, mas espelhado.
Com base nas considerações de espelhamento, os sinais que são adequados para compra não são adequados para venda, mas serão adequados para serem espelhados, e vice-versa.
O conceito de espelhamento sugere que a rede deve dar respostas no intervalo de -1 a +1, como antípodas, seja vendendo ou comprando.
Se o valor da resposta da rede estiver acima do limite, por exemplo, +0,8, então é uma compra, ou se o valor da resposta da rede estiver abaixo do limite, por exemplo, -0,8, então é uma venda.

5. Além da imagem do preço, a imagem dos volumes, mesmo os volumes de ticks, não deve ser negligenciada.
Não é importante se o volume é real ou de ticks, é importante apenas que a escala de volume tenha flutuações diárias e de sessão pronunciadas, o que significa que, no mínimo, não é inútil.
Entretanto, os valores de volume são unipolares e não se enquadram no conceito de espelhamento, e deve-se pensar cuidadosamente sobre como eles devem ser usados em uma rede com uma resposta bipolar.
Por exemplo, duas situações, preço sobe/volume sobe, preço desce/volume sobe, são espelhadas, mas o componente espelhado aqui é apenas o preço, e o volume permanece o mesmo.
Mas, por exemplo, o delta dos volumes (se houver) é totalmente consistente com o princípio do espelhamento.
Neste ponto, quero apenas enfatizar que nem todos os dados são antipodais por natureza, mas alguns deles devem permanecer eles mesmos (não espelhados), pelo menos para compra, pelo menos para venda.
Entretanto, a fórmula de propagação retroativa de erros não conhece essas peculiaridades...

 
Evgeny Shevtsov #:
Olá.


Vou colocar meus cinco centavos no tópico. ...

Obrigado, substantivo

 
Paradigma de busca:

Alvo - não a próxima vela ordinal ou a próxima leitura ordinal.

O alvo é o resultado de uma negociação a partir do momento atual.

Ou seja,

1) Adotamos qualquer estratégia. Aguardamos seu acionamento (abertura de posição). Registramos um conjunto de entrada (qualquer). Monitoramos a posição até que ela feche e registramos o resultado da negociação como meta.

2) Treinamos a estratégia usando qualquer método.

3) Executamos nossa estratégia (pomoichny)

4) Adicionar um filtro a ela - nosso NS.


Como resultado, precisamos colocar um pouco de esforço intelectual e criativo, paciência e tempo para aprender a estratégia.

O resto será feito pela rede neural.

Retiramos da rede neural o trabalho intelectual árduo simplesmente porque, na realidade atual, o NS não é capaz nem mesmo de determinar os níveis, se não os marcar "por si mesmo".

E ele fará o que deve fazer: moer o TS.
 
Ivan Butko #:
Paradigma de pesquisa: ...


Qualquer estratégia de negociação é aquela em que tal e tal ação de negociação é tomada somente sob tal e tal circunstância (ou conjunto de circunstâncias).

Se isso não for cumprido, não se trata de uma estratégia.


Portanto, a seguinte hipótese (suposição) é inevitável:

Se um determinado resultado de negociação foi obtido em uma determinada circunstância, então há uma expectativa de que, na mesma circunstância (ou em uma circunstância muito semelhante), o mesmo resultado será obtido.


A fórmula de retropropagação de erro é projetada de tal forma que, no processo de sua aplicação, a "circunstância nos inputs X" é movida (resumida/resumida) para os "valores de peso W".

Em outras palavras, os valores de peso são simplesmente a soma de muitas circunstâncias, cada uma das quais foi somada com seu próprio valor de coeficiente.

O valor do coeficiente é o resultado de uma determinada ação comercial tomada em uma determinada circunstância.

Portanto, em termos gerais, embora a fórmula seja um pouco mais complicada...


1. Se, sob duas circunstâncias semelhantes, forem obtidos dois resultados de negociação contraditórios, então, durante o procedimento de propagação reversa do erro, essas circunstâncias se extinguem mutuamente (passando de X para W).

2. Se, sob duas circunstâncias antisimilares (espelho), dois resultados comerciais semelhantes (em valor e em sinal) forem obtidos, então, sob o procedimento de propagação reversa do erro, essas circunstâncias também se cancelam mutuamente.

3. se dois resultados de negociação semelhantes (em valor e em sinal) foram obtidos em duas circunstâncias semelhantes, então essas circunstâncias se somam durante o procedimento de propagação reversa do erro.


E aqui é óbvio que a rede neural simplesmente capta a relação entre as circunstâncias e seus resultados de negociação, ou seja, detecta padrões.

E não apenas detecta, mas também os atualiza no processo de recebimento de um novo histórico.


Se, é claro, houver algo no item 3, contra o item 1 e o item 2 ...


Bem, e a manipulação da rede neural só pode ser iniciada com a aceitação inequívoca da hipótese acima.

E pode ser que ela esteja errada. ))


Quanto à remoção de um único resultado de negociação como uma estimativa de uma única circunstância sob a qual esse resultado foi obtido, acredito que, para circunstâncias diferentes, as estimativas devem ser iguais.

Ou seja, a mesma chamada "outra condição igual" deve ser atendida para diferentes circunstâncias.

Apenas um fator pode ser essa condição, o intervalo de tempo da retenção da transação.

 
Evgeny Shevtsov #:

...


Portanto, a seguinte hipótese (suposição) é inevitável: ...





Concordo plenamente. Você está certo: eu tenho hipóteses, suposições e fantasias. O ramo, em princípio, é praticamente o mesmo.




Ese houver alguma explicação, razão, motivo, é ainda mais interessante. Quanto aos NS, minha atitude em relação a eles é a seguinte: é uma caixa com um conjunto de regras "se, então". Não de outra forma. Mesmo que o sistema seja adaptativo, o próprio processo de adaptação é uma regra "se isso, então aquilo".



Caso contrário, é um processo aleatório. E, considerando que o mercado está se esforçando ou é completamente único, minha cabeça está se afogando em paradoxos: qualquer tentativa de explicar a existência de regularidades eternas (incluindo regularidades nos mecanismos de adaptação, ou seja, mudança/reotimização/aprendizagem) está atolada na impossibilidade e vagando no caos . Como resultado, eu simplesmente me aprofundo em sistemas simples, apesar deles. Dou uma olhada nos resultados dos complexos, se aparecerem artigos.
 
Evgeny Shevtsov #:

Quanto à remoção de um resultado de negociação como uma avaliação da circunstância em que esse resultado foi obtido, acredito que, para circunstâncias diferentes, as avaliações devem ser iguais.

Ou seja, a mesma chamada "outra condição igual" deve ser observada para diferentes circunstâncias.

Apenas um fator pode atuar como tal condição, o intervalo de tempo da retenção da transação.

A essência do uso da estratégia é receber um sinal em condições de mercado semelhantes (padrão global), de modo que os indicadores dos preditores descrevem esse momento do evento, não o mercado inteiro, o que, em teoria, reduz as contradições entre eles e o alvo. No final, o aprendizado está preocupado em encontrar elementos de regras que reforcem ou reduzam o padrão original. O ponto negativo dessa abordagem é a redução significativa de exemplos na amostra.

Quanto à marcação para o tempo, também é duvidosa, pois estamos interessados no vetor do movimento do preço na negociação, ou melhor, na trajetória, de modo que, idealmente, a marcação deve levar em conta não apenas onde o preço estará em n barras, mas também como ele chegará lá.

 
Aleksey Vyazmikin #:
Portanto, o ideal é que a marcação leve em conta não apenas onde o preço estará em n barras, mas também como ele chegará lá.

"A desvantagem dessa abordagem é uma redução significativa de exemplos na amostra."

Concordo, isso acontece.

Mas, fora isso, é um "mingau".


"... então, idealmente, a marcação deve levar em conta não apenas onde o preço estará em n barras, mas também como ele chegará lá."

Assim, obtemos a chamada pontuação R/S, cujo valor varia de -1 a +1, onde :

- S é o caminho total, ou seja, o comprimento da trajetória,

- R é o caminho líquido, como a distância entre o ponto inicial da trajetória e o ponto final da trajetória, que pode ser negativo.

Mas para que o conjunto de estimativas obtidas dessa forma seja igual entre si, o intervalo de tempo T aplicado para obter cada estimativa deve ser considerado igual.

E devo dizer que essa estimativa ainda não é autossuficiente.

RS

 
Evgeny Shevtsov #:

"O ponto negativo dessa abordagem é uma redução significativa de exemplos na amostra."

Concordo, isso acontece.

Mas, fora isso, é um "mingau".


"... então, idealmente, a marcação deve levar em conta não apenas onde o preço estará em n barras, mas também como ele chegará lá."

Assim, obtemos a chamada estimativa R/S, cujo valor varia de -1 a +1, onde :

- S é o caminho completo, ou seja, o comprimento da trajetória,

- R é o caminho líquido como a distância entre o ponto inicial da trajetória e o ponto final da trajetória, que pode ser negativo.

Mas, para que o conjunto de estimativas obtidas dessa forma seja igual, o intervalo de tempo T aplicado para obter cada estimativa deve ser considerado igual.



RS E devo dizer que essa estimativa ainda não é autossuficiente.

A leitura máxima de amplitude/espaço está faltando. É como se estivesse faltando
 
Ivan Butko #:
Quanto aos NS, minha atitude em relação a eles é que são uma caixa com um conjunto de regras "se, então". É assim que as coisas são.

Não é bem assim.

Na verdade, nem é bem assim.

))