Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 110

 
Yury Reshetov:

O problema da "explosão" combinatória em jPrediction foi resolvido não através de todas as combinações possíveis, mas através do método de busca sequencial. A essência do método é a seguinte:

Suponha que tenhamos encontrado alguma combinação contendo N preditores com o máximo de generalização, tentando todas as combinações possíveis de N e menos preditores. Temos de lhe adicionar o preditor N+1. Para isto, adicionamos um a um todos os preditores da amostra que não foram incluídos na combinação e medimos a sua capacidade de generalização. Se no processo de tal pesquisa encontrarmos uma combinação com preditores N+1 cuja capacidade de generalização seja superior à melhor combinação de preditores N, podemos encontrar uma combinação com preditores N+2 da mesma forma. E se eles não o encontraram, então é claro que não vale a pena procurar mais e o algoritmo de tentar combinações pára na melhor combinação de N preditores. Como resultado, o algoritmo de busca de combinações de preditores para o modelo pára muito mais cedo em comparação com a tentativa total de todas as combinações possíveis. A economia adicional de recursos computacionais ocorre devido ao fato de que a busca começa a partir de um pequeno número de preditores no sentido de aumentar esse número. E quanto menos preditores precisarmos para o treinamento, menos tempo e poder computacional precisaremos para construir modelos.

Olá Yuri!

Há perguntas )) sobre a busca sequencial ...

Digamos que temos 10 preditores.

1, 2, 3, 4, 5, 6, 7, 8, 9, 10

o grupoverde é o grupo de preditores que tem demonstrado a melhor capacidade de generalização; outros preditores N+1 serão adicionados a este grupo

o grupovermelho, é o grupo que é ligeiramente pior que o verde e não participará nos testes, todos os testes já estão focados no grupo verde

Pergunta: e se depois de todas as tentativas com outros preditores N+1, um a um, se verificar que no resultado final o grupo vermelho tem uma maior capacidade de generalização, isto também é bastante realista, ou estou a interpretar mal algo ???? por favor, explique

 
SanSanych Fomenko:

Tudo bem, exceto uma bagatela: não há comparação com outros modelos.

Comparação.

Eu apoio... Apenas tome as citações como dados e não algumas íris.
 
SanSanych Fomenko:

Tudo é bom, exceto uma bagatela: não há comparação com outros modelos.

Eu ofereço os meus serviços para comparação

1. Você prepara um arquivo Excel de entrada contendo os preditores e a variável alvo

2. Você faz o cálculo

3. Você me envia o arquivo de entrada.

4. Eu faço os cálculos usando a randomforest, ada, SVM

Nós comparamos.

Não há necessidade de ir longe, aqui está o arquivo com cotações de mercado forex, a capacidade média de generalização quando treinada pelo preditor reshetov é de 70% a 80%. Nusssss...... À espera do seu resultado.

P.s. Renomear o arquivo para csv

Arquivos anexados:
 
Mihail Marchukajtes:

Não há necessidade de ir longe, aqui está um arquivo com cotações do mercado forex, a capacidade média de generalização quando treinado com o preditor Reshetov é de 70% a 80%. Wellsssss...... À espera do seu resultado.

P.s. Renomear o arquivo para ksv

Não podia ser empacotado?

E não é possível ver o resultado? Na verdade, a generalização na formação não tem nada a ver.

 
mytarmailS:
secundado por... Basta tomar citações como dados e não algumas íris.
São os dois arquivos Reshetov com os resultados do algoritmo que são de interesse
 
SanSanych Fomenko:

Não podia estar embalado?

Não podemos ver o resultado? Na verdade, a generalidade na aprendizagem não tem a ver com nada.

Eu não podia concordar mais.

 
Mihail Marchukajtes:

Não há necessidade de ir longe, aqui está um arquivo com cotações forex, a capacidade média de generalização quando treinado com o preditor Reshetov é de 70% a 80%. Wellsssss...... À espera do seu resultado.

P.s. Renomear o arquivo para csv

O que é isso? 71 observações?

como é que verificou a capacidade total?

 
mytarmailS:

O que é isso? 71 observações?

como é que verificou a capacidade total?

E ainda estás a tentar refrear o mercado de minutos em 5 anos?????? Essas 71 observações, duas semanas de negociação em 5 minutos se algo...... E só compra. Então vá em frente..... Ou você está deflacionado?
 
Mihail Marchukajtes:
E você continua a tentar refrear o mercado de minutos durante 5 anos?????? Estas 71 observações, duas semanas de negociação em 5 minutos se algo...... E só compra. Então vá em frente..... Ou você está deflacionado?

Falando sem delicadeza europeia, estás a escrever um completo disparate...

Dê dois arquivos normais, pelo menos 500 observações cada um, assim como os resultados do programa.

 
Mihail Marchukajtes:

A capacidade média de generalização na aprendizagem com o preditor Reshetov é de 70% a 80%.

Como eu disse antes, esta métrica é inútil.

Os dados são divididos aleatoriamente em 2 partes aproximadamente iguais, depois o modelo é treinado apenas na primeira parte, e testado em ambas de uma só vez. Generalizabilidade de ~75% significa que o modelo no final prevê corretamente 75% de todos os exemplos em arquivo.
Existem várias variantes de como o modelo pode chegar a 75%:
1) O modelo é treinado com uma precisão de 100% nos dados utilizados para o treinamento, e falha de todo nos novos dados da segunda parte do arquivo, onde recebe 50% (o mesmo que atirar uma moeda ao ar). A média seria exactamente 75%. Este é um desenvolvimento muito ruim e será ruim no comércio.
2) O modelo foi treinado com precisão de 75% nos dados de treinamento e mostrou os mesmos 75% nos dados de teste, que é novamente 75% em média. Nesta situação, este é o melhor cenário, há uma chance de ganhar alguma coisa.
3) Qualquer opção intermédia entre estes dois.

A sua versão está provavelmente mais próxima da primeira. Você tem que confiar muito na sorte para negociar com tais resultados, eu acho que você não perdeu seu depósito ainda apenas graças ao indicador que serve como seu sinal principal (seqüente, ou o que quer que seja). Eu acho que um Expert Advisor baseado neste indicador lhe dará o mesmo resultado que o indicador + jPrediction.

Razão: