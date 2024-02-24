Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 3187
ZЫ Em geral, se houver interesse em tentar encontrar diferenças entre as duas linhas, podemos fornecê-las.
Dê uma olhada no que escrevi para você. Só poderei dar uma olhada pessoalmente no outono.
Forester#:
Fiz um experimento com a amostra na qual publiquei os gifs, já existem 47% de unidades na amostra, os dados estão resumidos em uma tabela.
Descrição do conteúdo das colunas:
Deixe-me explicar que, para um preditor, mais de um segmento quântico pode ser selecionado no total, e esses segmentos não devem se sobrepor no intervalo do valor do preditor.
O que eu não gosto é que na vizinhança de 50% dos alvos sejam deixados no lugar, o que pode afetar negativamente a avaliação do resultado.
De fato, verifica-se que muitos segmentos quânticos foram encontrados em alvos aleatórios, mas como eram alguns clusters (presumivelmente), diferentes tabelas sobrepuseram suas coordenadas, portanto, depois de selecionar intervalos não sobrepostos, verificou-se que a qualidade (utilidade) desses segmentos quânticos é pior (menor) do que os originais por um fator de 10. Assim, em média, na amostra com o alvo original, foram encontrados mais cortes quânticos para diferentes preditores em 3,5 vezes.
O que você acha dos resultados?
Adicionado:
O gráfico da sequência binária do alvo aleatório e do original tem a seguinte aparência
Pergunta para Alexei. Não sou bom em teoria estatística. Apenas sugeri misturar o alvo em vez da geração.
Entendo.
Tenho outra sugestão para você: e se tornássemos mais gerenciável o processo de construção da floresta e pegássemos uma subamostra específica do segmento quântico selecionado como raiz de cada árvore?
Faça a profundidade em torno de 2 a 3 divisões, de modo que os exemplos de classe classificável por folha sejam de pelo menos 1%.
Acho que o modelo será mais estável.
Dez simulações não são nada, você precisa de milhares para obter significância estatística.
Também não estou pronto para dar uma opinião especializada em um caso específico, mas apenas indiquei possíveis problemas e maneiras comuns de resolvê-los.
Milhares - exige muitos recursos de computação - uma passagem - cerca de 40 minutos - cálculo básico em uma placa de vídeo.
Em geral, eu achava que esse teste só permitia verificar a possibilidade de tais agrupamentos em diferentes intervalos do preditor.
E é necessário observar a probabilidade de atingir um intervalo específico do segmento quântico, que já foi inicialmente selecionado.
Ainda assim, eu gostaria de ouvir a opinião sobre a questão da diferença do alvo na expressão percentual para a confiabilidade desse teste.
Você está fazendo uma bobagem sem sentido e implacável. Saber, pelo menos, fez com que isso acontecesse em meia hora e esqueceu o assunto.
Guarde suas avaliações do desempenho de outras pessoas para si mesmo, especialmente quando não entende o que a outra pessoa está fazendo.
Estou aberto a críticas construtivas, e não há nenhuma vinda de você.
