Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 221

 
Andrey Dik:
Provavelmente a opinião mais sensata e objectiva do R que tenho visto ultimamente. O pensamento convencional é o que sofrem os velhos fãs de R, quem quer que você tire até deste fórum, todos eles pensam o mesmo, você pode até confundi-los entre si se não olhar para os apelidos, eles raciocinam da mesma forma.

Quando se discute R é impossível fazer sem você, embora não esteja nada claro o que você está fazendo aqui.

Mas já que estás aqui, pelo teu exemplo.

Você desenvolveu um algoritmo genético, você sabe como, talvez melhor do que qualquer outra pessoa no mundo.

Eu não sei como escrever algoritmos genéticos. E isto não é porque não o possa fazer, mas porque não preciso de o fazer.

Deixa-me explicar.

Em um sistema de negociação real eu uso a função rfe (backtesting dos preditores do caret). Não dá resultados muito bons. Devo usar o seu algoritmo genético? Cem vezes não, porque o mesmo carpete tem função gaf (seleção preditor por algoritmo genético). Mas além desse carpete tem outra função segura (seleção de previsão por robustez simulada - recozimento), que é muito mais eficaz em MEU PROBLEMA, do que o ALGORITMO GENÉTICO. O problema nos meus sistemas de trading é um, e as ferramentas são três, sendo a laboriosidade de substituir uma pela outra uma substituição de três letras. Além disso, e talvez o mais importante: TODAS AS TRÊS FUNÇÕES SÃO CONECTADAS COM OUTRAS FUNÇÕES QUE EU Preciso.

Eu não tenho o problema de programar um algoritmo genético. Mas ao resolver os meus próprios problemas posso facilmente usar vários algoritmos, incluindo um genético. Na realidade o problema é a seleção dos preditores, é um problema computacionalmente capacitivo e para resolvê-lo além do R listado há um grande número de ferramentas que são programadas NÃO em R.

 
J.B:

Depende do tipo de pesquisa, se a pesquisa do aluno para passar o termo, então sim, é muito mais fácil tirar uma função da prateleira, executá-la e obter um relatório padrão com gráficos bonitos, sem perguntas aqui.

Se pesquisar um engenheiro quant, em um escritório financeiro que tira dinheiro do mercado, não apenas através de comissões, ou tecnologia próxima do mercado, a situação é diferente. Como regra, nos escritórios certos, em 5 anos você constrói sua própria infra-estrutura comercial, onde há 95% de todas as ferramentas necessárias, que são convenientemente embaladas e você pode usá-las não muito mais complicado do que em R..........

Sim, está tudo claro e concordo contigo, mas estás a falar de produção, mas não há aqui quons, e não há pessoas com infra-estruturas que tenham sido feitas há 5 anos... e antes desta infra-estrutura ter sido feita havia pesquisa inicial, é onde está a maioria das pessoas, estão à procura de ideias, estás a falar de produção...

na minha opinião, o esquema é

1) procurando por uma idéia de trabalho

2) procurando por uma idéia de trabalho

3) procurando por uma idéia de trabalho

4) realizar vendas e outras infra-estruturas para a ideia (produção)

Agora estás a contrastar o primeiro ponto com o quarto - e é uma espécie de farsa, percebes o que quero dizer?

Bem, para o primeiro item, quando você precisa passar rapidamente por um monte de idéias R é uma coisa, para o quarto item é c++ naturalmente.

 

SanSanych Fomenko:

Eu não sei como escrever algoritmos genéticos. E não porque não o possa fazer, mas porque não preciso de o fazer.

Eu me lembrei porque na pré-criação lá eu fui solicitado a escrever uma bolha de separação ou mais rápido, sem olhar na internet, claro, eu escrevi, parecia uma tarefa infantil, mas então me disseram que 70% das pessoas não podem fazer isso. Penso que isto é correcto, existe um certo conjunto de algoritmos básicos que devem saber como 2+2=4 especialistas nesta ou naquela área, pois aumenta muito, pelo menos a capacidade de usá-los eficazmente, para não mencionar que para modificar e criar análogos mais eficazes. Quantum deve ser capaz de escrever MLP, baes, Knn, floresta, etc. sem espreitar. Isso é 2+2=4 para quant.

SanSanych Fomenko:

Eu uso a função rfe (seleção traseira de preditores do carpete). Não dá resultados muito bons. Há uma função gaf...

Bem, sim, esse é o tipo de conversa que os consumidores têm com "dezenas de milhares de funções" que não entendem, mas apenas tentam. Infelizmente tudo o que eles te dão já está experimentado e não há "nenhum peixe lá", especialmente em relação ao algotrading, toda essa riqueza de funções é ilusória, algotrading em sua essência não pode ser papoula, aqui você precisa ser capaz e adorar reinventar a roda, caso contrário você será conduzido em um "carro chique" apenas para um depósito de lixo ou o cemitério, não você que está dirigindo)))

 
mytarmailS:

Sim, está tudo claro e concordo contigo, mas estás a falar de produção, mas não há aqui quons, e não há pessoas com infra-estruturas que tenham sido feitas há 5 anos... e antes desta infra-estrutura ter sido feita havia pesquisa inicial, é onde está a maioria das pessoas, estão à procura de ideias, estás a falar de produção...

na minha opinião, o esquema é

1) procurando por uma idéia de trabalho

2) procurando por uma idéia de trabalho

3) procurando por uma idéia de trabalho

4) realizar vendas e outras infra-estruturas para a ideia (produção)

Agora estás a contrastar o primeiro ponto com o quarto - e é uma espécie de farsa, percebes o que quero dizer?

Bem, para o primeiro item, quando você precisa passar rapidamente por um monte de idéias R é uma coisa, no quarto item é c++ naturalmente.

Esquema errado, pois em algotrading muitos processos estão interligados e interdependentes. Você não pode procurar por uma idéia isoladamente dos dados e um profundo entendimento dos algoritmos que a processam. Assim, por exemplo, "procurando idéias" em velas minúsculas de um par de moedas é.... Nada"um", na carteira de encomendas do mercado russo é outro, na carteira de encomendas de dezenas de líderes mundiais de trocas e fornecedores de dados macroeconómicos é outro, etc. O mesmo se passa com o processamento, a ideia e as ferramentas estão intimamente relacionadas, a abordagem incremental faz sentido, mas não o "vácuo", quando uma ideia é procurada como um cavalo esférico e implementada com C++. Por exemplo, como você acha que a idéia demodelagem da dinâmica de livros de pedidos com limite de alta freqüência com máquinas vetoriais de suporte será conveniente na implementação? Experimenta e depois diz-me. Só posso dizer que no artigo também é 2+2+4, mas na realidade é muito mais complicado.

 
J.B:

Uma vez trabalhei um ano num escritório de gamediver, lembrei-me disto, pois na entrevista preliminar pedia para escrever uma bolha separadora ou mais depressa, sem olhar para a Internet, claro, escrevi, pensei que era TOR infantil, mas depois fiquei esclarecido que 70% das pessoas não o conseguem fazer. Penso que isto é correcto, existe um certo conjunto de algoritmos básicos que devem saber como 2+2=4 especialistas nesta ou naquela área, pois aumenta muito, pelo menos a capacidade de usá-los eficazmente, para não mencionar que para modificar e criar análogos mais eficazes. Quantum deve ser capaz de escrever MLP, baes, Knn, floresta, etc. sem espreitar. Isso é 2+2=4 para quant.

Não quero parecer um não detective, mas é estranho que um profissional como você, e mesmo trabalhando na Quantum Foundation, não soubesse o que é a correlação cruzada já este anohttps://www.mql5.com/ru/forum/71816

Индикатор опережения\отставания временного ряда
Индикатор опережения\отставания временного ряда
  • www.mql5.com
Индикатор опережения\отставания временного ряда.
 
J.B:

Não é o esquema certo, porque no comércio algorítmico muitos processos estão entrelaçados e interdependentes. Você não pode procurar por uma idéia isolada dos dados e um profundo entendimento dos algoritmos para processá-la. Então, por exemplo, "à procura de ideias" em velas minúsculas de um par de moedas, é.... Nada"um", na carteira de encomendas do mercado russo é outro, na carteira de encomendas de dezenas de líderes mundiais de trocas e fornecedores de dados macroeconómicos é outro, etc. O mesmo se passa com o processamento, a ideia e as ferramentas estão intimamente relacionadas, a abordagem incremental faz sentido, mas não o "vácuo", quando uma ideia é procurada como um cavalo esférico e implementada com C++. Por exemplo, como você acha que a idéia demodelagem da dinâmica de livros de pedidos com limite de alta freqüência com máquinas vetoriais de suporte será conveniente na implementação? Experimenta e depois diz-me. Só posso dizer que no artigo também é 2+2+4, na realidade tudo é muito mais complicado.

Eu concordo com o hft, mas não entendo porque você sempre o cita como exemplo, você não pode evitar saber que tais datas não estão disponíveis para ninguém, nenhuma das pessoas aqui tem dinheiro para comprar corretores de encomendas do Ocidente e canais rápidos.

Por que até falar sobre isso e fazer disso um exemplo?

 
mytarmailS:

Não quero parecer um detective, mas é estranho que um profissional como você, que trabalha num fundo quântico, não soubesse o que é a correlação cruzada este anohttps://www.mql5.com/ru/forum/71816

Oh, vá lá... Estava então a resolver um problema bastante complexo, e estava sentado em casa, doente, não era conveniente pedir aos colegas, tinha um mês para arranjar um emprego, depois descobri eu mesmo, e depois de algum tempo o Rev. Combinador chamado exatamente a mesma solução. A outra questão é se você enfrentou tal problema, você provavelmente não o teria resolvido, porque aqui você precisa saber como a correlação cruzada entre linhas é implementada em níveis baixos e adivinhe como usá-la, R não tem tal função "fila de atraso", e o mais importante, você simplesmente não teria definido tal problema)))) Então você não é um quant em um fundo de hedge.

 

SanSanych Fomenko:


Ao promover a linguagem R como meio de resolver eficazmente as tarefas de negociação, você menciona constantemente a facilidade de usar suas ferramentas e a ampla gama de suas capacidades. Ninguém argumenta com isso. Mas as suas declarações mostram claramente o seu desconhecimento dos princípios desta linguagem.

Claro que você é um bom navegador de suas funções, e sabe quais delas são necessárias para resolver suas tarefas, mas obviamente você ignora completamente os mecanismos escondidos por trás desses nomes. Você não sabe como eles funcionam. Além disso, você não quer saber e dissuade os outros de fazer isso.

Você é um usuário de R. Você gosta desta ferramenta porque é fácil de usar mas não pela eficiência na resolução de tarefas concretas das quais você não sabe nada e não aspira saber.

Entenda que um desenvolvedor difere de um usuário precisamente em seu desejo de entender o mecanismo e alcançar a máxima eficiência de seu funcionamento.

Este objectivo só pode ser alcançado com um conhecimento absoluto do assunto. A facilidade de criar algo é irrelevante aqui.

Na verdade, você está convidando os desenvolvedores a esquecer seu trabalho e se tornar meros usuários. Aproveite a facilidade de uso das ferramentas que você fornece e esqueça completamente de investigar os princípios do seu trabalho.

Com tal abordagem, a eficiência pode ser esquecida, e os desenvolvedores não podem esquecê-la.

Se você começar a entender o funcionamento dos mecanismos velados em R, você pode descobrir que eles não são tão perfeitos quanto podem parecer a um entusiasta diletante.

Com este posto estou tentando articular um ponto de vista que se opõe a você, mas posso estar errado em relação aos outros. No entanto, é assim que vejo o problema.

 
mytarmailS:

Eu concordo com o hft, mas não entendo porque você sempre o cita como exemplo, você sabe que tais datas não estão disponíveis para ninguém, ninguém aqui tem o dinheiro para comprar os emissores de ordens do oeste e canais rápidos.

Porquê falar sobre isso e torná-lo um exemplo?

Não generalize. Você pode começar com o OL do mercado russo. E o HFT como só funciona. HFT e interno.
 
J.B:

Vá lá... Eu estava resolvendo um problema bastante complexo na época, e estava sentado em casa, doente, não era conveniente perguntar aos colegas, eu tinha um mês para conseguir um emprego, então eu mesmo descobri, e depois de um tempo o Sr. Kombinator disse exatamente a mesma solução. Combinador chamado exatamente a mesma solução. A outra questão é se você enfrentou tal problema, você provavelmente não o teria resolvido, porque aqui você precisa saber como a correlação cruzada entre linhas é implementada em níveis baixos e adivinhe como usá-la, R não tem tal função "fila de atraso", e o mais importante, você simplesmente não teria definido tal problema)))) Portanto, você não é um quant em um fundo de hedge.

Eu não sou tão burro quanto você pensa, note a palavra cross correlation, eu disse isso no seu ramo, mas foi o que você fez, quando eu aprendi sobre cross correlation eu tive a mesma idéia que você sobre comparação de séries(então você não está sozinho e não é único nisso) e isso foi muito antes do seu ramo, mas eu nunca cheguei perto disso...

J.B:
Não generalize. Você pode começar com o OL no mercado russo. E o HFT como só funciona. HFT e interno.

você pode estar certo.... mas penso que os OLs disponíveis são escritos a velocidades mais rápidas do que a plaza, e vai acontecer que o teste em um e a realidade será diferente, posso estar errado, mas esta é a impressão que eu tenho

Razão: