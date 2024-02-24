Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 79
Eu usei o método "repeatedcv" no trainControl, com uma divisão padrão. Recentemente eu mesmo escrevi código para a validação cruzada, tentei a validação cruzada tanto com barras tiradas aleatoriamente como com pedaços tirados consecutivamente, sem lacunas. Não vi nenhuma diferença na frente, deu aproximadamente o mesmo resultado em ambos os casos. Eu dividi os dados para treinamento/crossvalidação 50%/50%, talvez nessa proporção não tenha mais importância.
Vou fazer experiências com isso em carpete...
Lembro-me que naquele artigo que você postou há algum tempo atrás, a comparação principal foi o aumento de árvores com o método de Platt (algo parecido com isso). Tudo o que encontrei no google sobre este método é que você tem que passar a saída do modelo para sigmoid e pegar o seu resultado. O gbm ou o xgboost podem fazer isso? Esta abordagem parece ser melhor do que floresta, neurônio e algumas "árvores ensacadas" que vêm em segundo lugar.
Sobre o CV. O padrão é o particionamento aleatório... Para as séries temporais, a separabilidade temporal é importante... podes fazer isso em carpete. O CV da série temporal Caret dobra à medida... Procura-o. No meu código que publiquei antes. É implementado no controlo de comboios.
Estou a olhar para ti e estou espantado... Queres tirar algo do nada. Ou seja, você quer obter 0,0000000000000000000000000000000000000000 resultado a partir de zero. Não posso ver mais nada disto, por isso, vou dar-te uma ajuda. Na verdade, a topologia da rede é secundária. Na aprendizagem mecânica, em forex e mais além, os dados vêm primeiro. Ou seja, o mais importante no desenho de redes neurais não é a topologia da rede ou o método de treinamento. São dados de entrada e dados de saída. Se os dados são relevantes para o mercado - mesmo um pequeno perseptron resolverá o seu problema de classificação e funcionará bem no futuro, por uma simples razão, porque os dados de entrada são relevantes para o mercado e estes dados são capazes de prever. E o que você está tentando fazer é arranhar a superfície de informações irrelevantes. Desculpe, mas o resultado também será irrelevante.... Quanto ao mercado, em forex, o principal é o volume, e depois a reação do mercado a ele. E não o volume que está em MT (tick), mas o volume real de futuros, o mesmo euro. Use o delta de cluster para o ajudar. Há muita informação útil. Assim, usando o volume de negócios, irá aumentar significativamente o desempenho de qualquer rede, mesmo a mais simples perseptron. Também tem um delta, que também é extremamente útil. Mas você está tentando construir um modelo com base em indicadores que são secundários, eu diria terciário depois do preço e você espera um milagre a partir dele. Não vai haver milagre, garanto-vos.....
P.S., pensa em quem estás a tentar concorrer contra... Empresas com equipas dos programadores mais fixes, com mais poder de processamento do que o seu quad-core. Com dinheiro investido no desenvolvimento de novos métodos, etc. E aqui Alexey do simples interior russo decidiu entrar no mercado em 5 anos e conseguir o graal. Desça dos céus e tire os óculos cor de rosa........
Na aprendizagem mecânica, em forex e mais além, os dados vêm primeiro. Ou seja, o mais importante ao desenhar redes neurais não é a topologia da rede ou o método de treinamento. São dados de entrada e dados de saída. Se os dados são relevantes para o mercado, qualquer perseptron, mesmo um pequeno, resolverá seu problema de classificação e funcionará bem no futuro, por uma simples razão, porque os dados de entrada são relevantes para o mercado e esses dados são capazes de prever isso.
Nem sequer tenho nada com que discutir, está correcto. Sabemos disso também, e estamos discutindo não apenas modelos de classificação, mas também métodos de seleção de preditores (dados de entrada), leia primeiro este tópico.
Presumo que você esteja esperando selecionar manualmente uma dúzia de entradas, construir um modelo, trocar por uma semana, começar a perder, começar a escolher entradas novamente. Eu também já fiz isso, às vezes tenho estratégias engraçadas como "pegar um certo grão para inicializar o neurônio, treiná-lo exatamente 7777 iterações, tudo ficará bem, mas todas as terças-feiras você tem que trocar contra o seu sinal". Otimizar a rede com novos dados dia sim, dia não". Tais estratégias são reais, mas leva muito tempo para escolher algo assim e só dá lucro por algumas semanas. Tudo porque tal estratégia é baseada em algum padrão de curto prazo.
Em vez disso, seleciono um algoritmo para seleção automática de entradas. É simples, existem cerca de 100 entradas em cada barra e um algoritmo que selecciona uma tal combinação de entradas que todas juntas dão consistentemente um sinal de compra/venda válido durante todo o ano. Não é como a otimização dos Expert Advisors em mt5, onde um EA pode alcançar grandes resultados e falhar na frente, mas é mais complicado, com validações cruzadas e critérios diferentes de estimar o resultado. Eu costumava selecionar cerca de cem entradas, agora é menor, apenas algumas dúzias. Eu tenho 60%-70% de precisão na frente, mas ainda é instável, eu preciso me livrar dos graus de liberdade em todo o processo de seleção e treinamento para obter aproximadamente os mesmos resultados, mesmo começando do zero a cada vez.
P.S., pensa só em quem estás a tentar enfrentar... Empresas com equipas dos programadores mais fixes, com mais poder de processamento do que o seu quad-core. Com dinheiro investido no desenvolvimento de novos métodos, etc. E aqui Alexey do simples interior russo decidiu entrar no mercado em 5 anos e conseguir o graal. Desça do céu e tire os óculos cor-de-rosa........
Empresas com instalações próprias e programadores utilizam o mesmo software de análise e modelação de dados que temos à nossa disposição. Digamos que eles treinam o modelo perfeito e obtêm 100% de lucro por mês. Tenho menos poder, com os mesmos dados poderei construir um modelo mais fraco com, digamos, apenas 50% do lucro. Isto vai ser suficiente para mim.
Demagogo, ouch. Já estava na hora de saíres daqui. Construir uma casa.
"O cão ladra, a caravana vai." С
As empresas com suas instalações e programadores utilizam o mesmo software de análise e modelagem de dados disponível para nós. Eles vão treinar um modelo perfeito e obter 100% de lucro por mês. Tenho menos poder, com os mesmos dados posso construir um modelo mais fraco, com, digamos, apenas 50% do lucro. Eu vou ficar bem.
Deixa-me pôr as coisas desta maneira. Os fundos de topo mostram um retorno médio anual de 40-50%. Eles podem trabalhar lá tanto pessoas inteligentes como excelentes. Não vejo nada de anormal que me aproxime a 50% ao ano e que tenha este crescimento.
Primeiro - os fundos mostram um rendimento tão miserável por uma única razão, a falta de liquidez no mercado, é difícil colocar uma grande quantidade de dinheiro na estratégia, você não tem tais problemas
Segundo - Porque não apontar para 100% por mês, digamos?
Concordo plenamente comMihail Marchukajtes, a fim de elevar a qualidade do reconhecimento que precisamos para elevar a qualidade dos sinais, e modelos.... sua influência +/- 5% sobre o resultado global
Você também é um demagogo. Bem, mostre-nos as entradas com este grau de informatividade. Porque levamos os modelos de topo? Para espremer sinais a partir de dados ruidosos, se tivéssemos dados sem ruído, também poderíamos fazer uma fórmula em excel.
"100% por mês". Esforce-se, mostre resultados, compartilhe idéias. Vamos ouvi-lo, como aumentar a sua rentabilidade em 20 vezes e como não se retirar no próximo mês do sorteio.
"long-livers" de forex. Mais de 5 anos de negociação. Ordenado por FS. Sim, alguns têm retornos cósmicos, mas outras estatísticas são más. Isto é a realidade. E a Stabiliti está a trocar de mãos. Todos os outros mostram FS de 3 e menos.
O homem recomenda a leitura de "MSUA" e análise espectral em particular de Fourier
========================================================
Além dos resultados que eu "demagogo" tenho alcançado, mas na verdade muito modestos, boas idéias como eu penso muito, minha pesquisa está indo em várias direções simultaneamente e há uma enorme falta de conhecimento em vários campos, porque muitas vezes pedir ajuda aos participantes do fórum, mas especialmente para ajudar e ninguém quer, eles dizem que você aprende sozinho, e então..... só se eu mesmo tiver dominado tudo então porque eu faço esta comunicação, pois sem lógica, eu me distraio.
Aqui está a melhor coisa sobre o dan. Mãe. que eu consegui espremer de RF nos novos dados é 50% por mês durante 2 meses seguidos, mas tudo ainda está muito instável, tentei preencher as fotos 10 vezes, mas não consegui (consegui)
O resultado final é que você não deve se limitar com modelos como 30% ao ano é legal, não é legal, é uma estrutura para a mente e criatividade