Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2606

 
Maxim Dmitrievsky #:

Há uma pergunta como esta:

São utilizados dois modelos. Um prevê comprar ou vender, o outro prevê trocar ou não trocar.

Primeiro o primeiro modelo é treinado, depois olhamos onde ele prevê mal, marcamos estes exemplos como "não trocar", os outros bons como "trocar", depois treinamos o segundo modelo.

O primeiro modelo é testado não só na área de treinamento, mas também na área adicional e o segundo modelo é treinado em ambas as áreas.

Repetimos isto várias vezes, re-treinando ambos os modelos no mesmo conjunto de dados. Os resultados melhoram gradualmente com as amostras. Mas nem sempre na amostra de controlo.

Paralelamente, mantemos um registro de maus negócios cumulativo para todos os passes, todos os "maus" negócios para "não negociar" são coletados nele para treinamento do segundo modelo e filtrados de acordo com um certo princípio, como quanto mais cópias de maus negócios para todos os passes, maior a chance de marcá-los como "não negociar".

Por exemplo, para cada data alguma quantidade de negócios ruins é acumulada para todas as iterações de treinamento, onde essa quantidade excede um limite (média, média), esses negócios são marcados como "não negociar". O resto das negociações são ignoradas, caso contrário seria possível excluir todas as negociações se houvesse muitas iterações de treinamento.

permite ajustar o número de negócios na saída, quanto mais baixo for, mais negócios são filtrados

... por esta altura já estou cansado de escrever...

Como pode tal combinação de modelos ser melhorada de modo a melhorar os seus resultados numa nova parcela independente?
Existe alguma filosofia sobre o porquê de isto poder funcionar? Para além do facto de os modelos melhorarem naturalmente uns aos outros (quedas de erro) em cada volta de treino, mas como se livrar do ajuste?

Conceito interessante!

1. Como se livrar da adaptação. Eu não entendo muito sobre iterações. Por que você não pode treinar o modelo de filtragem (segundo) uma vez e avaliar se ele melhora/não melhora o desempenho do primeiro. Você poderia apenas filtrar os sinais 1 a 2, ou alimentar a saída 2 para a entrada 1.

2. Como melhorar.
2.1. Você poderia tentar fazer uma marcação pós-transação em uma marcação de cluster. Certamente que os sinais ruins se acumulam. E os bons. Nós marcamos os grupos. Podemos treinar via abordagem transacional (fichas com base em entradas/candidatos), visando - encontrar-nos em um bom ou mau cluster. Ou você pode treinar por clusters (fichas por clusters, um objeto de amostra de treinamento - cluster), alvo - ou o mesmo (próxima vela em bom ou mau cluster) ou próximo cluster - bom ou mau (bem, provavelmente é a mesma coisa em essência).
2.2. As descrições de características devem provavelmente ser diferentes para estes modelos, caso contrário penso que a utilidade marginal do segundo modelo seria baixa.


3. Filosofia por detrás do conceito. Quem precisa disso, eficiência do modelo, lucro é a bitola. Os experimentos governam, não a filosofia).

 
Replikant_mih #:

Conceito interessante!

1. Como se livrar da prova. Eu não entendo muito sobre iterações. Por que você não pode treinar o modelo de filtragem (segundo) apenas uma vez e avaliar se ele melhora/não melhora o desempenho do primeiro. Você poderia apenas filtrar os sinais 1 a 2, ou alimentar a saída 2 para a entrada 1.

2. Como melhorar.
2.1. Você poderia tentar fazer uma marcação pós-transação em uma marcação de cluster. Certamente que os sinais ruins se acumulam. E os bons. Nós marcamos os grupos. Podemos treinar via abordagem transacional (fichas com base em entradas/candidatos), visando - encontrar-nos em um bom ou mau cluster. Ou você pode treinar por clusters (fichas por clusters, um objeto de amostra de treinamento - cluster), alvo - ou o mesmo (próxima vela em bom ou mau cluster) ou próximo cluster - bom ou mau (bem, provavelmente é a mesma coisa em essência).
2.2. As descrições de características devem provavelmente ser diferentes para estes modelos, caso contrário penso que a utilidade marginal do segundo modelo seria baixa.


3. Filosofia por detrás do conceito. Quem precisa disso, eficiência do modelo, lucro é a bitola. Os experimentos governam, não a filosofia).

Queremos melhorar a generalizabilidade do primeiro modelo (e do segundo também). Se simplesmente filtrarmos os seus sinais com o segundo modelo, o erro de classificação do primeiro modelo não se reduzirá em si mesmo. Então, nós tipo executamos os dois modelos treinados no conjunto de dados e largamos os maus exemplos do treinamento para o primeiro, para que o erro se torne menor. E o erro no segundo também cai. E por isso repetimos isto várias vezes. Deve melhorar a cada vez. Mas quero que fique melhor na amostra de cada vez, mas há uma grande variação.

Por isso acho que o que mais devo acrescentar, talvez algumas reflexões também sejam boas :)

 
Maxim Dmitrievsky #:

Queremos melhorar a generalização do primeiro modelo (e também do segundo modelo). Se simplesmente filtrarmos os seus sinais com o segundo modelo, o erro de classificação do primeiro modelo não irá reduzir internamente. Então, nós tipo executamos os dois modelos treinados no conjunto de dados e largamos os maus exemplos do treinamento para o primeiro, para que o erro se torne menor. E o erro no segundo também cai. E por isso repetimos isto várias vezes. Deve melhorar a cada vez. Mas quero que fique melhor na amostra de cada vez, mas há uma grande variação.

Estou a pensar no que mais devo acrescentar, talvez algumas ideias também possam funcionar :)

Você tem certeza de que precisa de 2 modelos e que eles irão melhorar os resultados no feedback?
Você pode simplesmente tomar o limite do primeiro modelo não até 0,5, mas até 0,3 e 0,7 ou mesmo 0,1 e 0,9 - assim, lida com a baixa probabilidade será eliminada e haverá menos deles e o modelo será apenas 1.
 
Aleksey Nikolayev #:

Não me interpretes mal... Portanto, prefiro baseá-lonas afirmações do verificável.

Não me interpretes mal. Eu estava apenas apontando a imprecisão de sua construção lógica: "não há algoritmos de jogo longo no mercado, caso contrário, mais cedo ou mais tarde eles seriam os únicos que sobrariam no mercado". Mostrei-te exactamente em que nicho eles existem. Por que eles existem lá isolados, em vez de capturarem todo o mercado. E deu um exemploverificável.

Об авторе | QuantAlgos
  • www.quantalgos.ru
Приветствую вас в моем блоге. Меня зовут Виталий, занимаюсь написанием биржевых роботов c 2008 года. В 2009 и 2010 гг. участвовал в конкурсе ЛЧИ (лучший частный инвестор) под ником robot_uralpro, проводимом биржей РТС  (сейчас Московская биржа). Использовались HFT роботы, написанные на C#.  Результаты были следующие: В настоящее время продолжаю...
 
elibrarius #:
Tem a certeza de que precisa de 2 modelos e que eles vão melhorar o resultado no OOS?
Você poderia simplesmente tomar o limite do primeiro modelo não até 0,5, mas até 0,3 e 0,7 ou mesmo 0,1 e 0,9 - assim os negócios de baixa probabilidade serão eliminados e haverá menos deles e o modelo será apenas 1.

com 2 há mais flexibilidade, estas probabilidades são... apenas o número de negócios diminui, a estabilidade não.

 
Maxim Dmitrievsky #:

com mais 2 de flexibilidade, estas probabilidades são... apenas o número de negócios diminui, a estabilidade não.

Você também não tem estabilidade com 2...
 
Dr #:

Não me interpretes mal. Eu estava apenas apontando a imprecisão de sua construção lógica: "não há algoritmos de jogo longo no mercado, caso contrário, mais cedo ou mais tarde eles seriam os únicos que sobrariam no mercado". Mostrei-te exactamente em que nicho eles existem. Por que eles existem lá isoladamente, mas não capturam todo o mercado. E deu um exemploverificável.

A verificação da existência real de uma determinada declaração não significa verificar o seu conteúdo.

Mesmo se assumirmos (embora possa haver e muitas vezes haja problemas com isso) que alguém está ganhando dinheiro estável ano após ano, não está nada claro como provar que isso é feito pelo mesmo algoritmo pode até parecer. Eu gostaria de ver opções mais substanciais do que "acredite na sua palavra" e "é isso que lhe estou a dizer".

 
Maxim Dmitrievsky #:

com 2 mais flexibilidade, estas probabilidades são... é só que o número de ofícios diminui, a estabilidade não.

é melhor com 3.

;)

 
elibrarius #:
Também não se tem estabilidade com 2...

muitas opções, é difícil de comparar

 
Maxim Dmitrievsky #:

muitas opções, é difícil de comparar

Já tem um exemplo de um pacote de 2 modelos em funcionamento. Uma variante com o 1º modelo (com um corte até 0,1-0,9 ou 0,2-0,8) é fácil de fazer deles e comparar a sua estabilidade no OOS.
Razão: