mytarmailS #:
É necessário salvar uma pessoa que está obviamente se afogando, mas que gosta de se suicidar?
Quando você lhe oferece ajuda, ele a rejeita, discute com você, não tenta fazer nada para sair por conta própria e dita seus próprios termos, como..:
"Ou você mesmo me salva, me carrega para fora da água segurando-me sobre sua cabeça ao som da minha música favorita, ou não.
E então você não tem nenhum desejo de me salvar.


Sente-se na margem - herói - a escolha é sua.

Eu já lhe disse o suficiente sobre qual é a questão e por que a solução do problema aumentará a estabilidade do modelo.

De que adianta se gabar de que você conhece um pacote em R que pode resolver tal e tal problema se eu não puder usá-lo?

 
Aleksey Vyazmikin #:

Até o momento, as tentativas não foram bem-sucedidas. Você quer tentar?

Não. Tente você mesmo (enquanto os próximos cálculos estão sendo feitos e você levará tempo), os idiomas são semelhantes.

Aleksey Vyazmikin #:

Você forneceu o método mais simples - sim, não é difícil.

Outros têm a mesma essência simples. Descrevi algumas opções no texto - pular duplicatas e recalcular o tamanho do quantum de base levando em conta as duplicatas. Há também a divisão não por número, mas por intervalo e a combinação desses métodos.

 
Forester #:

O problema não é apenas a execução mecânica, mas como calcular malhas não proporcionais. As distribuições de densidade de probabilidade são construídas lá e já são quantificadas, pelo que entendi.

Não tenho muito tempo livre e prefiro gastá-lo codificando o que sei fazer. Talvez, se esta for a última tarefa, eu me sente e fique pensando por dias a fio, mas, por enquanto, prefiro seguir em outras direções deste projeto. O bom é que as tabelas de quantificação podem ser descarregadas.

 
Aleksey Vyazmikin #:

As distribuições de densidade de probabilidade são construídas lá e já estão quantificadas,

Qual método de quantificação? Todos eles estão nessa página.

 
Aleksey Vyazmikin #:

se eu não puder usá-lo?

Disseram a você o que fazer, deram a você um pacote.

Tudo o que você precisa fazer é abrir o Google.
É complicado.

Digite o nome do pacote.
Não é fácil.

Abra um tutorial.
Missão impossível...

Copie três linhas do código de exemplo.
Bem, você provavelmente deveria pedir ajuda a profissionais, pelo menos uma dúzia deles...


E quando você diz tudo isso, recebe uma resposta - Eu preciso, mas não vou fazer isso, faça isso para mim e publique o código pronto para mim aqui, porque eu preciso dele.... E eu não vou fazer isso sozinho, porque não posso, e por que não posso, porque não posso...



 
Forester #:

Qual método de quantificação? Todos eles estão nessa página.

Método GreedyLogSum - como exemplo, você pode ver que a grade não é uniforme. Presumo que uma distribuição lognormal seja construída por meio da aproximação das métricas de amostra e, em seguida, a grade é feita de alguma forma. Não consigo ler as fórmulas.

Aqui estão as fórmulas em detalhes.

 
mytarmailS #:
Disseram a você o que fazer e lhe deram um pacote.

Você pode falar, mas não sei se pode ouvir.

Sim, a ideia da árvore de decisão poderia ser uma ideia funcional para a criação de uma tabela quântica. Obrigado pela ideia!

Mesmo que eu tenha encontrado um pacote desconhecido e até criado uma árvore.

Em seguida, preciso lidar com loops no R, salvando árvores.

E em que formato elas são salvas? Provavelmente na forma de regras, o que significa que preciso criar um analisador que transforme essas regras no formato necessário.

Não seria mais fácil para mim resolver o problema por meio de um histograma com intervalos uniformes de 0,5%, combinando colunas semelhantes em métricas/condições?


E, em geral, perguntei inicialmente sobre métricas que caracterizam a amostra que caiu no corte quântico. Se não tiver ideias nesse sentido ou se não quiser pensar, diga-me.

Caso contrário, estamos acostumados a fazer um show aqui - é por isso que este tópico é um lixo.

 
Aleksey Vyazmikin #:

Método GreedyLogSum - como exemplo, você pode ver que a grade não é uniforme. Presumo que uma distribuição lognormal seja construída usando as métricas de amostra por meio de aproximação, e a grade seja feita de alguma forma. Não sei como ler as fórmulas.

Aqui estão as fórmulas em detalhes.

Essa função simples também criará uma grade irregular por valores. Uniforme é Uniforme.

GreedyLogSum Maximize a aproximação gulosa da seguinte expressão dentro de cada compartimento:
i = 1 n log ( w e i g h t ) , w h e r e i=1nlog(weight),where
- n n - O número de objetos distintos no compartimento.
- - w e i g h t weight - O número de vezes que um objeto no compartimento é repetido.


Funciona com o número de repetições/duplicatas. Tudo é praticamente o mesmo. Não consegui encontrar a função (com uma rápida pesquisa), portanto, não posso dizer com certeza... Descrevi as variantes da contabilidade de duplicatas anteriormente, acho que é uma delas ou algo próximo.

 
Forester #:

Essa função simples também tornará a grade desigual em valores. Uniforme é Uniforme.

Ele funciona com o número de repetições/duplicatas. Tudo fica mais ou menos igual. Não consegui encontrar a função (em uma pesquisa rápida), portanto, não posso ter certeza... Descrevi as opções de contabilização de duplicatas anteriormente, acho que há uma delas ou algo próximo disso.

Acho que é apenas uma questão de levar em conta os pesos no caso de valores repetidos, ou seja, aparece um pouco de volume e a grade é comprimida nesse segmento.

Acho que você conseguirá resolver o problema!

 
Aleksey Vyazmikin #:

Acho que é apenas uma questão de levar em conta os pesos no caso de valores repetidos, ou seja, aparece um pouco de volume e a malha encolhe nesse segmento.

Acho que você conseguirá resolver isso!

Talvez, mas não estou vendo o peixe aí. Eu não uso quantificação de forma alguma. Prefiro explorar dados flutuantes.

