Estatísticas de dependência entre aspas (teoria da informação, correlação e outros métodos de seleção de características) - página 10

 

Fale sobre um tipo diferente de dependência.

Como "a" depende de "b" fora de qualquer texto? Não é assim, ou seja, você não pode obter "a" de outros personagens.

E se dependesse de 1, 2, 3, 4, 5, 6, digamos? Obviamente, não é um conjunto muito apropriado para o alfabeto, no entanto, você o rotula.

Não é verdade?

 
TheXpert:

Fale sobre um tipo diferente de dependência.

Como "a" depende de "b" fora de qualquer texto? Não é assim, ou seja, você não pode obter "a" de outros personagens.

E se dependesse de 1, 2, 3, 4, 5, 6, digamos? Obviamente, não é um conjunto muito apropriado para o alfabeto, não importa como você o rotula.

Não é assim?

Por que não? O sistema de número hexadecimal. É um alfabeto normal - tão bom quanto binário :)

E as letras russas Y, Y, Y podem ser derivadas de outras letras.

 
Avals:

E as cartas russas yu, ya, yo podem ser derivadas de outras cartas.

Não cartas, mas sons :)

Ou é como essa piada? "Que língua russa simples -- a palavra "yosh" é soletrada com duas letras!"

 
TheXpert:

Não cartas, mas sons :)

Ou é como essa piada? "Que língua russa simples - a palavra "yosh" é soletrada em duas letras!"

bem, não puxe))))). Há também exemplos em outros idiomas onde um caractere é substituído por vários, ou seja, um caractere pode ser derivado dos outros. Eu simplesmente não entendo bem o princípio disto. E de qualquer forma, como você determina se é o alfabeto correto ou não?
 

Também estou um pouco confuso, mas algo me diz que HideYourRichess está certo.

A comparação com um sistema numérico provavelmente não é muito correta. Um número pode ser representado por um único número, enquanto as citações têm muitas representações, ou seja, um símbolo pode ser expresso por um número enorme (infinito para ser mais exato) de variantes através de outros símbolos, ou seja

a == tsdrmiikepi == fsrpl == mflncp == javlporpor == fwlfrmilfpf == .

Não está certo, imho.

 

Cavalheiros, vi um artigo de pesquisadores alemães apenas na veia do tema. Eu a postarei quando a encontrar. Ou seja, não proponho nada de novo, tudo foi estudado por pelo menos 10 anos.

Há um pesquisador Battiti (você pode pesquisar o artigo através das palavras Seleção Mútua de Informações). Ele é o pai da metodologia de seleção de variáveis com a ajuda de informações mútuas. Há colegas que trabalham com diferentes fontes de dados experimentais, em particular, com dados sobre a atividade solar (que é geralmente uma fonte popular de valores). E os resultados confirmam a utilidade das estatísticas I (X,Y) para prognóstico. Terei que ler sobre como ele discretiza valores aleatórios ali e cria uma alfabetização. Ninguém parece ter se preocupado tanto com a teoria ainda (como os veteranos locais).

 

O que o sistema numérico tem a ver com isso, TheXpert? Não entendo porque a conversa se transformou em sistemas numéricos.

Honestamente, não vejo nenhum dos argumentos da HideYourRichess que de alguma forma interfiram com a aplicação da TI para citações.

 
Mathemat:

O que o sistema numérico tem a ver com isso, TheXpert? Eu não entendo porque a conversa mudou para sistemas numéricos.

Não é uma virada, apenas uma questão de opinião. O que há de errado com os números como um alfabeto?

Honestamente, não vejo nenhum dos argumentos da HideYourRichess que de alguma forma interfiram com a aplicação da TI para citações.

Escolha do alfabeto.

______

Taki eu provavelmente preferiria lê-lo.

 
TheXpert:

Também estou um pouco confuso, mas algo me diz que o HideYourRichess está certo.

A comparação com um sistema numérico provavelmente não é muito correta. Um número é representado por um único número, enquanto as citações são representadas por muitas variantes, ou seja, um símbolo pode ser expresso por um número enorme (infinito para ser mais exato) de variantes através de outros símbolos, ou seja

a == tsdrmiikepi == fsrpl == mflncp == yawlporpor == fwlfrmilfpf == .

Nada bom, imho.


escrever a palavra "Desordem" em diferentes idiomas e o mesmo é verdadeiro :) e mesmo o mesmo alfabeto pode dar exemplos de sinônimos, ou palavras obsoletas

s.w. Um número também pode ser representado de uma infinidade de maneiras, dependendo do cálculo, que na verdade é um alfabeto.

O alfabeto é uma coisa nocional - inventada pelo homem para listar um grande número de objetos e fenômenos com um número menor de caracteres. Naturalmente, os personagens devem ser um conjunto discreto. Não há outros requisitos rigorosos para isso - é uma questão de usabilidade.

 
Mathemat:

Mathemat:

HideYourRichess, se você acha que todo o terver se deve à série de Bernoulli ou à lei dos grandes números, você está muito enganado.

Eu não penso assim, eu sei disso de fato.

Isso são cinco! Eu quero dois!
HideYourRichess: Você não entende que estamos falando de uma seqüência de eventos independentes lá?

De que eventos independentes você está falando? Sobre uma seqüência de caracteres alfabéticos da fonte? Não, eles não são necessariamente independentes, isso já foi explicado a você. Um texto literário russo comum é uma seqüência de letras dependentes. Se fossem independentes, os textos literários seriam muito pior comprimidos pelo arquivador do que realmente são. Pegue algum texto literário e embaralhe-o e compare os resultados do arquivamento do original e do embaralhado.

Ou você acha que os conjuntos fonte e receptor são variáveis independentes?

A noção de entropia da informação foi introduzida por Shannon para personagens independentes. Se você não acredita em mim, consulte um dicionário acadêmico. Não discutirei mais com você sobre este assunto. Não se pode calcular a entropia das informações para o mercado, pois não se conhece o alfabeto, não se conhece a freqüência dos símbolos e a independência dos símbolos também é desconhecida (mas sabemos que as ações dos participantes do mercado são muito dependentes).

A próxima questão, a entropia condicional, é apenas o caso quando existem dependências entre os caracteres do alfabeto original. Isto não é o mesmo que entropia da informação, que foi discutida.

Não entendo a que conclusões o exemplo com o arquivador o leva, mas vou dizer o seguinte. A tarefa do arquivador é traduzir a entropia condicional em entropia informativa. Ou seja, para criar um alfabeto limitado perfeitamente definido, os caracteres dos quais, na seqüência resultante, seriam tão independentes quanto possível. Se você misturar a estrutura ordenada de um texto literário no nível da letra, é claro que essas seqüências de letras seriam quebradas e a compressão se deterioraria. Na medida em que um conjunto completamente aleatório de cartas não pode mais ser comprimido. E daí? O que isso tem a ver com o assunto?

Razão: