Aleksey Vyazmikin #:

Não vi uma pergunta respondida no link.

Uma pergunta feita corretamente geralmente já contém uma resposta. Aparentemente, essa pergunta ainda não foi feita.

Talvez você deva se perguntar o que é similaridade como um todo e o que o agrupamento tem a ver com isso.

Se você precisa estimar a densidade de probabilidade de uma distribuição (estou tentando adivinhar a partir da pergunta inarticulada), então é a estimativa da densidade do kernel.
 
Maxim Dmitrievsky #:
Se você deseja sinceramente ajudar, eu o sobrecarregarei com os detalhes do problema.

Portanto, temos uma fórmula condicional:

P=A/(A+B)*100-x.

Onde A e B são números inteiros, digamos de 1 a 1000.

x é algum coeficiente, mesmo que tenha um valor fixo para simplificar, e pode ser removido na mente.

Há uma amostra, digamos, de 500 linhas.

Para cada linha, calculamos o valor de P. Dividimos os resultados em intervalos por um ou outro método e, como resultado, temos uma distribuição empírica.

No entanto, a fórmula em si fornece valores comparáveis para diferentes valores de A e B, o que é lógico, porque, em essência, contamos a porcentagem da população, portanto, é importante que eu faça uma correção para o número A e, para isso, outro espaço é criado, onde o valor de A na fórmula é especificado, e o diagrama empírico também é construído.

Isso produz um diagrama 3D, que pode ser escrito como uma matriz.

Tenho cerca de 10 mil matrizes desse tipo e quero agrupá-las por similaridade.

Portanto, preciso de um método de agrupamento que as reúna em grupos. É claro que eu gostaria que elas fossem semelhantes não apenas por pontos individuais, mas também por distribuições.

Por exemplo, podemos comparar as distribuições de cada camada (particionando pelo número A) e, em seguida, calcular a porcentagem de distribuições semelhantes. Mas talvez haja uma boa solução pronta.

Eu descrevi claramente a essência do problema?

É assim que se encontra o número ideal de clusters. Você pode tentar uma mistura gaussiana em vez de kmins.
 
Aleksey Vyazmikin #:

No entanto, com quem estou falando - um amante de soluções prontas para uso.....

Aleksey Vyazmikin #:

Digamos que você possa comparar as distribuições de cada camada (particionando pelo número A) e, em seguida, calcular a porcentagem de distribuições semelhantes. Mas talvez haja uma boa solução pronta.

Como você pode fazer isso? )))

 
mytarmailS #:

Como isso é possível? )))

como se ele tivesse pego você e se vangloriasse))))))

Aqueles que podem criar soluções personalizadas também podem usar soluções prontas, mas o contrário não.

Portanto, você não me pegou.

Andrey Dik #:

Existe um fenômeno chamado hiperatividade, quando uma pessoa parece estar em todos os lugares e, ao mesmo tempo, em lugar nenhum. Da mesma forma, o uso descontrolado de pacotes leva mais à fadiga e à desorientação, e depois à raiva, do que à obtenção de um mínimo de conhecimento :)
 
Maxim Dmitrievsky #:
Existe um fenômeno chamado hiperatividade, quando uma pessoa parece estar em todos os lugares e, ao mesmo tempo, em lugar nenhum. Da mesma forma, o uso descontrolado de pacotes leva à fadiga e à desorientação, e depois à raiva, em vez de levar à aquisição de um mínimo de conhecimento :))
você é um otimista, Max, acho que é muito pior))).
Testei o bot que lancei aqui no dia 15 de maio, um mês se passou. Com diferentes resultados de sl e tp, mas, em média, todos no crescimento.


 
Maxim Dmitrievsky #:

Testei o bot que lancei aqui no dia 15 de maio, um mês se passou. Com diferentes resultados de sl e tp, mas, em média, todos no crescimento.


Take 5 pips stop 50 ?
mytarmailS #:
Take 5 pips stop 50 ?

É um padrão de longo prazo, o sinal permanece em uma direção por um longo tempo.

Mostrei isso durante 20 anos, apenas mais de 1.000 negociações. As retiradas curtas são uma das saídas , caso contrário, haverá poucas negociações.

