Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2739
Alexei, é uma tarefa de pesquisa normal, como você gosta, qual é o problema?
Então o script faz isso ou não?
Só me pergunto quantas pessoas aqui perdem facilmente o fio da meada da conversa.
Posso postar uma amostra com vários preditores, quem conseguir selecionar os melhores - muito bem - vamos fazer um concurso.
Os melhores serão determinados em uma amostra independente, após o treinamento do modelo nos preditores selecionados.
Alguém quer participar ou todos são capazes de fazer isso de boca em boca?
E , éclaro, é necessário fornecer exemplos de código reproduzíveis, caso contrário, não haverá uso prático das palestras .
Boa sorte a todos
O SSF não disse muita coisa nova, é claro, o objetivo de encontrar correlação entre preditores e resultados é um objetivo óbvio. A única coisa nova que percebi foi que ele encontrou cerca de 200 recursos significativos para todo o treinamento, mas para dados específicos, ele usa apenas 5% deles.
Entendo que isso significa que há algumas maneiras de determinar rapidamente o estado/as propriedades de uma série para selecionar preditores mais significativos apenas para os dados mais recentes. É claro que surge a questão do volume ou do comprimento para a seleção adequada. Mas, aparentemente, isso funciona mesmo com apenas 200 preditores encontrados e selecionados em todo o grande treinamento.
Euvejo isso da seguinte forma. Uma série tem propriedades que são estáveis em alguns índices, mas esses índices e seu número são diferentes em seções diferentes. O MO encontra alguns estados diferentes de duração suficiente de estabilidade da série, que podem ser descritos por modelos diferentes e, consequentemente, configurações de modelo - preditores. O número total de preditores é o número total de configurações para diferentes modelos e, portanto, ao definir um modelo, é possível encontrar rapidamente as configurações encontradas anteriormente para ele.
Uma vez publiquei uma tabela neste tópico, mas agora ela não está disponível, então vou esclarecer minha ideia em palavras.
Como assim, eu pedi para fazer um script - sim, eu cito: " Você pode fazer um script em R para cálculos para minha amostra - eu o executarei para fins de experimento. O experimento deve revelar o tamanho ideal da amostra. ", mas isso é uma resposta a algo que já foi feito.
Anteriormente, escrevi "... E como você propõe observar a dinâmica, como realizá-la? " - aqui eu estava perguntando sobre a implementação da estimativa do preditor na dinâmica, ou seja, estimativa regular por alguma janela e não está claro se é uma janela a cada nova amostra ou após cada n amostras. Se foi isso que você fez, eu não entendi.
O código que você publicou é ótimo, mas é difícil para mim entender o que ele faz exatamente ou o que ele prova em essência, então comecei a fazer outras perguntas. O que significam as duas figuras com gráficos?
Então, em essência, você tem a mesma abordagem que eu, curioso! Só que talvez busquemos a "conexão" de forma diferente. Como janelas, eu pego 10 amostras de gráficos e procuro por "conexão" neles, como você faz isso?
Qual é o seu algoritmo para encontrar uma conexão? Pode descrevê-lo?
Então, em essência, você tem a mesma abordagem que eu, curioso! Só que talvez busquemos a "conexão" de forma diferente. Como janelas, pego 10 parcelas de amostra e procuro "conexão" nelas, como você faz?
Qual é o seu algoritmo para encontrar uma conexão? Pode descrevê-lo?
Eu uso meu próprio algoritmo - ele funciona muito mais rápido do que várias bibliotecas do R. Por exemplo,
library("entropy")
Você pode usar apenas gráficos:
Tudo foi postado neste tópico. Tudo é sistematicamente descrito e analisado em nível de código nos artigos de Vladimir Perervenko