Avaliando a eficácia dos filtros na construção de um ATC - página 4

 
-Aleks-:

A diminuição das negociações certamente levará a mudanças nos índices estimados da estratégia (conjunto), essa é a questão de quanto é aceitável mudá-los.

Por exemplo, sem o filtro, a otimização para toda a gama de parâmetros básicos dá um lucro médio de 100k e 35% das perdas (perda de depósito) com uma média de 500 negócios. Depois de usar o filtro, o lucro médio é de 10k e 5% de perdas com uma média de 250 negócios - o lucro diminuiu 10 vezes, e a porcentagem de resultados ruins por apenas 7, enquanto o número de negócios diminuiu 2 vezes - é bom ou ruim? Qual é a maior prioridade?

Nas estatísticas existe algo como a comparação de amostras.

Suponha que uma experiência seja realizada. O assunto é estudar o efeito de algum fator. Neste caso, é o efeito de um filtro.

Duas amostras são comparadas. A primeira amostra é o conjunto inicial de resultados de todas as transações, a segunda amostra são os resultados filtrados.

A hipótese nula é que o filtro não funcionou, a hipótese alternativa é que o filtro filtro filtrou algo.

Alex, imho, perde a etapa inicial de estimativa - desenhar distribuições de resultados de todos os negócios e procurar por outliers e depois removê-los. Caso contrário, um indicador como o "lucro médio" não é representativo.
 

Dennis Kirichenko:

Alex, imho, falta o passo inicial na estimativa - construir distribuições dos resultados de todos os negócios e procurar por outliers, e depois removê-los. Caso contrário, um indicador como o "lucro médio" não é representativo.

Como você se propõe a procurar essas variações? Eu ainda não entendi totalmente do que se trata, mas suspeito que se trata de normalização dos dados? Se se trata simplesmente de peneirar resultados ilógicos, que não se encaixam no quadro da teoria da estratégia, então se supõe que este passo já foi dado, mas se se trata de excluir os resultados altamente proeminentes, então é necessário ter uma justificativa para sua exclusão.

Embora eu, pelo contrário, tente não excluir variantes pouco atraentes, mas aceitáveis, a idéia é que o mercado é volátil (como regra, a variedade de seu comportamento pode ser vista em diferentes instrumentos).

 
-Aleks-:

Como você se propõe a procurar esses outliers? Eu não entendo totalmente o que se trata, mas suspeito que se trata de normalização dos dados? Se se trata apenas de peneirar resultados ilógicos que não se encaixam na estrutura da teoria da estratégia, então está implícito que este passo já está dado, mas se se trata de excluir resultados altamente proeminentes, então você precisa de uma justificativa para sua exclusão...

Portanto, existe um procedimento estatístico. Sim, certo - nos livramos de elementos da população, cujos valores eram grandes ou pequenos demais.
...Ao contrário, estou tentando não excluir opções pouco atraentes, mas aceitáveis, a idéia é que o mercado é volátil (como regra, a variedade de seu comportamento pode ser vista em diferentes instrumentos).
Sim, volátil. Mas essa é outra questão. A idéia aqui é simples - precisamos avaliar se o filtro afetou ou não o desempenho da estratégia.

Imho, metodologicamente é mais correto não procurar alguns indicadores para descrever os resultados da otimização e depois brincar com eles, mas comparar 2 amostras - antes e depois :-)

E as amostras podem ser compostas de qualquer critério de resultado. Eu escrevi acima sobre os resultados dos acordos. Mas você pode levar outros... A propósito, é uma tarefa interessante...
 
Dennis Kirichenko:
Portanto, existe um procedimento estatístico. Sim, isso mesmo - livrar-se dos elementos da população, cujos valores eram grandes ou pequenos demais. Sim, é variável. Mas essa é outra questão. A idéia aqui é simples - precisamos avaliar se o filtro afetou ou não o desempenho da estratégia.

Então eu realmente faço isso calculando a média de todos os indicadores - desta forma os valores aberrantes são nivelados, certo? Eu faço uma convolução dos resultados da otimização (com uma divisão em dois atributos - mas é para maior clareza - um deles pode ser removido - ou seja, uma das opções será obviamente pior) e comparo a convolução (há valores máximos e mínimos de alguns indicadores e sua estrutura como porcentagem de outliers - e você ainda não olhou para o arquivo) apenas para nivelar o efeito das emissões. Além disso, no agregado, faço uma comparação de 13 pares de moedas separadamente por compra e venda. Como resultado, comparo 13*2*2=52 resultados médios de otimização. Se o filtro estiver funcionando globalmente, ele deve funcionar para todos os pares, ou seja, deve haver uma tendência positiva.

Dennis Kirichenko:

Acho metodologicamente mais correto não procurar alguns indicadores para descrever os resultados da otimização e depois brincar com eles, mas comparar duas amostras - antes e depois :-)

E as amostras podem ser compostas de qualquer indicador de resultados. Eu escrevi acima sobre os resultados dos acordos. Mas você pode levar outros também... A propósito, é uma tarefa interessante...

Amostras não são todas, mas uma parte - que atributo tomar para selecionar esta parte?

Se realmente interessante, estou pronto para publicar para análise detalhada os resultados da otimização - por exemplo, um par sem filtros e com filtros - dados comparáveis.



 
Так я это и делаю фактически путем усреднения всех показателей - таким образом выбросы нивелируются, разве нет? 
Não. As emissões são levadas em consideração. E elas podem afetar muito a média. Isto é fundamentalmente errado.

Então, é importante ver a forma da distribuição da amostra. Se for muito diferente do normal, por exemplo, ter um par de picos, não é bom... então é isso, em poucas palavras...

As amostras não são todas, mas parte delas - que atributo deve ser usado para distinguir esta parte?

Se for realmente interessante, estou pronto para publicar para análise detalhada os resultados da otimização - por exemplo, um par sem filtros e com filtros - dados comparáveis.

Amostragem aqui porque, por definição, não há toda uma população em geral. Em resumo, aqui é o que é - vemos apenas parte do fenômeno (história comercial).

Sim, você pode olhar para ele.

Alex, primeiro você precisa de 2 amostras(resultados de otimização):

1) estes são passes sem filtro;

2) estes são passes com filtro (somente aqui os parâmetros do filtro não devem ser otimizados, mas devem ser fixados).
 
Dennis Kirichenko:
Não. Os outliers são levados em consideração. E elas podem afetar muito a média. E isto é fundamentalmente errado.

E se as emissões não forem acidentais?

Dennis Kirichenko:

Sim, você pode ver.

Alex, primeiro você precisa de 2 amostras(resultados de otimização):

1) estes são passes sem filtro;

2) estes são passes com filtro (somente aqui os parâmetros do filtro não devem ser otimizados, mas devem ser fixados).

O arquivo contém resultados de otimização sem filtro e com posições variáveis do filtro 7 - separados em folhas separadas, de modo que não deve haver problemas com sua análise, e configurações diferentes darão uma resposta à pergunta quanto filtrar.

Escolheu a pior opção - par EURUSD M15 para 2013-2015 - compre somente.

Sem filtragem:

Sem filtro

Com filtro - os limites do interruptor do filtro em 7 posições são distinguíveis no gráfico:

Arquivos anexados:
 

Dennis Kirichenko, há dados suficientes ou seu interesse se desvaneceu?

 
-Aleks-:

Dennis Kirichenko, há dados suficientes ou seu interesse se desvaneceu?

Um dia vou ver, desculpe, tenho estado muito ocupado...
 
Dennis Kirichenko:
Vou dar uma olhada no outro dia, desculpe, tenho andado muito ocupado...

Ótimo, eu acho que será interessante e informativo!

 
Vejamos a coluna "Lucro Líquido", 1ª folha Standart (embora a Standard seja provavelmente mais correta).

Vamos primeiro calcular a estatística descritiva. Em particular, quero saber se há outliers.





Há aberrantes. Diz respeito aos negócios mais deficitários, com o prejuízo superior a 58.351,76.

Histograma.



A idéia é remover as emissões e analisá-las mais a fundo. Mas há aqui alguns outliers. E removê-los é mais um truque metodológico. De acordo com a forma atual, a distribuição com outliers não parece ser normal, o que significa que há um fator que influencia mais o resultado do que outros.



Razão: