Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 402

 
Aliosha:

XGB - https://en.wikipedia.org/wiki/Xgboost é a arma de fusão da aprendizagem de máquinas.

3 meses para o hft não é suficiente, para um ciclo completo de simulação, já que o modelo precisa ser testado em diferentes mercados, mudanças de regime, coberturas flash e diferentes cisnes, os testes de estresse sintético não podem fazer isso como o mercado real. O modelo final não utilizará mais do que uma semana de dados, mas para configurá-lo você precisará executá-lo em amostras de 1-3 anos para ter certeza de que não estrague tudo. Em 3 meses os dados podem ser treinados e, se os cientistas de dados souberem do seu material, vai acabar por se tornar um criador de dinheiro regular, mas um dia, talvez em 3 meses, talvez em meio ano, tudo pode quebrar abruptamente, por razões "desconhecidas", ou melhor, conhecidas, já que o modelo não encontrou tal meta estado do mercado e possibilitou o amadorismo.


ah, você precisa se reciclar sistematicamente, de que adianta treinar um jangada em 5 anos, não são necessários nem os nervos nem os recursos

Ah, o aumento do declive... ouviu-te, ouviu-te, mas não o fizeste. Quanto mais para dentro da floresta, mais complicados são os termos.

 
Maxim Dmitrievsky:


Eles não têm sentido para treinar oftalmologista em 5 anos, não têm coragem nem recursos para fazê-lo.

Talvez os tipos doLTCM também tenham feito esse argumento). Eles dizem que se tivessem olhado para trás duas vezes mais longe nos seus modelos, não se teriam fundido tão ferozmente.

Em qualquer caso, o treinamento não vai imediatamente para toda a amostra de 5 anos, é claro que a janela deslizante toma uma amostra, com aprendizado constante, mas é importante saber quão rápido o modelo "sabe" quando algo muda fortemente no mercado e não é um outlier, não é a estupidez de alguém, e não vai preencher corajosamente contra uma tendência repentina, o chamado de Kolya.

 
Aliosha:

Talvez os tipos doLTCM também tenham feito esse argumento). Eles dizem que se tivessem olhado para trás duas vezes mais longe nos seus modelos, não se teriam fundido tão ferozmente.

O aprendizado em qualquer caso não vai imediatamente para toda a amostra de 5 anos, é claro que a janela deslizante toma uma amostra, com aprendizado constante, mas é importante saber quão rápido o modelo "sabe" quando algo muda fortemente no mercado e isso não é um outlier, nem a estupidez de alguém, e não vai preencher corajosamente contra uma tendência repentina, a chamada Kolya.


Mdya...... você consegue cagar no trabalho, enquanto você mesmo está falando de coisas completamente diferentes. Como regra, o modelo não é bom quando quebra a linha de suporte da curva de equilíbrio e depois recupera, como mostrei anteriormente... Se confiar ou não no trabalho do modelo é uma questão filosófica. Ninguém está a dizer que três meses de dados é muito pouco. MAS eu tenho uma pergunta, como você sabe como eu os recolho e o que eles se referem?????? Só por curiosidade. O que o faz pensar que o modelo perderá o seu significado de repente se lhe forem apresentados todos os desenvolvimentos de mercado possíveis durante três meses?????

Você tem que entender o que é antes de poder prever o mercado. Sim, o mercado muda num período global, mas eu uso dados que causam o preço, ou seja, são esses dados que mudam o preço e não vice-versa. Além disso, após carregar os dados, utilizo um algoritmo único para remover o lixo e, portanto, obtenho os mesmos modelos. Embora o meu ofício em si não seja muito mesquinho. Eu preciso urgentemente de um ROBOT. E uma pergunta para o público... Alguém tem um esqueleto de robô que leva em conta as requisições, ouds e outras coisas no real trading?????

 
Mihail Marchukajtes:


Ninguém está a dizer que três meses de dados é muito pouco. MAS minha pergunta é como você sabe como eu os recolho e o que eles relacionam?????? Só por curiosidade. O que o faz pensar subitamente que o modelo não teria sentido se todos os desenvolvimentos de mercado possíveis lhe fossem apresentados dentro de três meses?????

Se você treinou em 3 meses de dados, você não pode esperar que o modelo dure muito mais tempo. O mercado que o modelo viu, é aquele em que ele será capaz de negociar. O seu conjunto de dados é um disparate, negociar com ele é como adivinhar com borras de café. O mesmo se aplica à "Máquina de Reshetov" que obtém coeficientes para um modelo linear, enquanto os dados não são nada lineares. Não é preciso estar nada distante para acreditar neste disparate que, num conjunto de dados de <500 pontos, um modelo linear levou semanas a aprender, porque é "AI")))))))))..... Eu não sei.... é mais lixo do que "martingale" e "depoimento".

 
Aliosha:

Se você treinou com 3 meses de dados, não pode esperar que o modelo dure muito mais tempo. Que mercado o modelo tem visto, ele será capaz de negociar. O seu conjunto de dados é um disparate, e negociar com ele é como adivinhar com borras de café. O mesmo se aplica à "Máquina de Reshetov" que obtém coeficientes para um modelo linear, enquanto os dados não são nada lineares. Não é preciso estar nada distante para acreditar neste disparate que, num conjunto de dados de <500 pontos, um modelo linear levou semanas a aprender, porque é "AI")))))))))..... Eu não sei.... é mais um disparate do que "martingale" e "subir o depósito".


O valor da semana???? Alyosha, você é realmente ALESHA Ha ha ha.... Que tipo de pessoas são hoje em dia. Ladnaya Alexeyushka você nosso, essa é a nossa primeira leitura do artigo aqui e você vai entender que meus 500 pontos que eu colecionei por três meses, porque eu não enfiei o classificador em cada barra, e faço isso em um determinado momento e, portanto, 500 pontos cobrem o mercado por 3 meses, e que o seu modelo não pôde treinar nele corretamente, então isso é porque você tem um sistema "porcaria" de IA. Eu até o coloquei entre parênteses para algum tipo de elogio :-) Eh Alyosha, Alyosha...... Então eu vejo que no fim de semana os trolls estão acordados também..... Tudo bem, eu pessoalmente não me importo, eu vou te contar no final de outro segredo, só para desenvolver, assim você entende a quem "você está cuspindo".

A todos aqueles que pensavam que o meu conjunto de dados era pior que 50%!!!!!!! O seu sistema de IA não está construído correctamente ou há um erro no mesmo OU!!!!!!!! E depois há o rufar de tambores de.... Seu sistema é limitado pela quantidade de material que você está aprendendo, você está usando grades que são capazes de aprender corretamente em 2-3 semanas (vamos tomar como regra que não há nenhum tipo de reciclagem) e trabalhar por uma ou duas semanas. Tais sistemas existem e não há nada de errado com eles ESTE WORKS!!!! MAS quando você deixa cair um grande conjunto de dados sobre ele, ele fica horrivelmente sobre-treinado ou sub-treinado, o que eventualmente leva a grandes erros de treinamento e você começa a pensar que o conjunto de dados não presta, bastante razoável para seus sistemas de IA. MAS, quando um sistema de IA é realmente legal, ele é capaz de construir um modelo (e não de treinar demais) mesmo neste conjunto de dados que VOCÊ falhou em.... Você vê!!!! Apenas o modelo será composto por um grande número de entradas, acho que assim 10-12 e o polinômio será longo o suficiente e acredite em mim, tal modelo terá mais de 50% de lucro. Ou melhor, mesmo para o optimizador REACH existe um limite, mas é muito mais do que aqueles que falharam..... Como esta.....

 

E o interessante é que o principal resultado deste otimizador é a porcentagem de generalização e eu construí modelos com 100% de generalização. Mas com o aumento da porcentagem da amostra começa a cair, e no momento em que ela cai abaixo de 50%, o modelo começará a diminuir. Mas é mais provável que seja próximo da marca dos 50. De qualquer forma, se houver um peixe nos dados, ele irá encontrá-lo, se não, será tarde demais.....

Também é muito bom em responder à questão de quão bons os dados são para a variável selecionada, se os dados forem porcaria, eles serão imediatamente visíveis....

Sou hilariante, dividi o conjunto de dados que afixei e uma das amostras é de 138 linhas, corri-o, estou à espera de.... Vou publicar os resultados se eu estiver interessado....

 
Mihail Marchukajtes:


Quero dizer semanas???? Alyosha, você realmente é Alyosha Ha ha ha .... Que tipo de pessoas são hoje em dia? Ladnaya Alexeyushka você nosso, essa é a nossa primeira leitura do artigo aqui e você vai entender que meus 500 pontos que eu colecionei durante três meses, porque eu não empurro o classificador a cada barra, e faço isso em um certo tempo e, portanto, 500 pontos cobrem o mercado por 3 meses, e que o seu modelo não pôde treinar corretamente, então isso é porque você tem o seu sistema de IA "porcaria". Eu até o coloquei entre parênteses para algum tipo de elogio :-) Eh Alyosha, Alyosha...... Então eu vejo que no fim de semana os trolls estão acordados também..... Eu pessoalmente não me importo, vou deixar-te no final mais um segredo só para te desenvolveres, para que compreendas quem estás a "enganar".

Para todos aqueles que pensavam que o meu conjunto de dados era pior que 50%:!!!!!!! O seu sistema de IA não está construído correctamente ou há um erro LIBO!!!!!!!! E depois há o rufar de tambores de.... Seu sistema é limitado pela quantidade de material que você está aprendendo, você está usando grades que são capazes de aprender corretamente em 2-3 semanas (vamos tomar como regra que não há nenhum tipo de reciclagem) e trabalhar por uma ou duas semanas. Tais sistemas existem e não há nada de errado com eles ESTE WORKS!!!! MAS quando você deixa cair um grande conjunto de dados sobre ele, ele fica horrivelmente sobre-treinado ou sub-treinado, o que eventualmente leva a grandes erros de treinamento e você começa a pensar que o conjunto de dados não presta, bastante razoável para seus sistemas de IA. MAS, quando um sistema de IA é realmente legal, ele é capaz de construir um modelo (e não de treinar demais) mesmo neste conjunto de dados que VOCÊ falhou em.... Você vê!!!! Apenas o modelo será composto por um grande número de entradas, acho que assim 10-12 e o polinômio será longo o suficiente e acredite em mim, tal modelo terá mais de 50% de lucro. Ou melhor, mesmo para o optimizador REACH existe um limite, mas é muito mais do que aqueles que falharam..... Como esta.....


E o mais interessante é que o principal resultado desse otimizador é a porcentagem de generalização e eu estava construindo modelos com 100% de generalização. Mas com o aumento da porcentagem da amostra começa a cair, e chegará um momento em que ela cairá abaixo de 50%, e então o modelo irá cair. Mas é mais provável que seja próximo da marca dos 50. De qualquer forma, se houver um peixe nos dados, ele vai encontrá-lo, se não, então é uma confusão.....

Também é muito bom em responder à questão de quão bons os dados são para a variável selecionada, se os dados estiverem cheios de merda, eles serão vistos imediatamente....

Sou hilariante, dividi o conjunto de dados que afixei e uma das amostras é de 138 linhas, corri-o, estou à espera.... Vou publicar os resultados se eu estiver interessado....

Não vou discutir com você, não há nada para discutir, você está falando bobagem completa, "100% generalização" )))))) Acho que você nem entende a diferença entre modelo linear e não-linear. E "Reshetov's machine" é linear, não pode nem c XOR, é uma otimização estúpida de coeficientes de divisão do hiperplano por alguma pseudo genética, balbucia infantil...

É isso, eu não ofendo crianças, sou um tio mau e malvado, disse que o Pai Natal não existe)))

 
Aliosha:

Eu não vou discutir com você, não há nada para discutir, você está cheio de bobagens, "100% generalização" )))))) Acho que você nem entende a diferença entre modelo linear e não-linear. E "Reshetov machine" é linear, não pode sequer c XOR, é apenas a optimização de coeficientes hiperplanos por algum tipo de pseutogenética, balbucia infantil...

Isso é tudo, eu não ofendo crianças, sou um tio mau e malvado, disse-me que o Pai Natal não existe)))


YEAH!!!!! Eu sou o Pai Natal!!! E todos os anos felicito as crianças por estas belas férias. Você até conseguiu perder para mim aqui :-)
 
Alyosha:

Eu não vou discutir com você, não há nada para discutir, você está cheio de bobagens, "100% generalização" )))))) Acho que você nem entende a diferença entre modelo linear e não-linear. E "Reshetov's machine" é linear, não pode nem c XOR, é uma otimização estúpida de coeficientes de divisão do hiperplano por alguma pseudo genética, balbucia infantil...

Isso é tudo, eu não ofendo crianças, sou um tio mau e malvado, disse-me que o Pai Natal não existe)))


Vou dar-lhe um modelo com um nível de generalização de 100%....
 
Mihail Marchukajtes:

Vou enviar-lhe um modelo com 100% de generalização....
Não há necessidade de soprar o graal, troque com urgência, troque! Todos lhe agradecerão :)
Razão: