Estatísticas de dependência entre aspas (teoria da informação, correlação e outros métodos de seleção de características) - página 7

 
TheXpert:

Como eles podem ser discretos se você está trabalhando com incrementos relativos?

E a segunda pergunta -- qual é o número de caracteres ) ?


E nós os desacreditamos. Há dois esquemas principais: são quantis (tornando o PDF igual) e espaçamento igual (o PDF é muito semelhante ao resultado sobre os dados brutos).

O número de caracteres é definido pelo pesquisador.

 
Mathemat: E para mim, nesta tarefa, a TI é principalmente uma ferramenta demineração de dados. O que fazer com estes dados é outra questão. O importante é que nós vemos algo que não é visível a olho nu. E de que outras ciências você está falando?

Abro no pacote STATISTICS a aba "data mining" - cerca de 20 nomes de seções e procedimentos separados. Tudo isso está perfeitamente de acordo com os livros e monografias neste campo, mas nada sobre TI para mineração de dados.

 
alexeymosc:
Obviamente, parece que em nossa interpretação do processo, estes são valores discretos de retorno.

Se você não envolve "economia e outros significados", então de que processos estamos falando? Um processo é um fenômeno "físico", tem causas e conseqüências. Por exemplo, o processo de queda de uma maçã na cabeça de Newton. Na aplicação aos mercados, o processo de compra e venda. Onde tudo isso se encontra no mercado?

Próximo ponto. O ter.ver, no qual se baseia o ter.inf, requer a independência dos eventos em questão, ou símbolos. Caso contrário, o uso desses aparelhos matemáticos é incorreto. Onde está a independência inerente? Suponha que eu, a partir de intenções especulativas, compre algumas ações (quero dizer, o mercado real, não a corretora), e um retorno ocorra nos preços. Depois de um tempo, depois de algum tempo, decidi vender estas ações e outro retorno aconteceu. Estes dois eventos estão claramente ligados um ao outro através de mim e minhas intenções especulativas. Como há muitos tolos como eu no mercado, e todos eles compram e vendem da mesma forma, todos os retornos acabam sendo vinculados - dependentes. Então, por que você está tentando aplicar um aparelho matemático a eventos dependentes de eventos independentes? É correto?

Sobre isto, tudo está longe de ser óbvio.

 
faa1947:

Abro no pacote STATISTICS a aba "data mining" - cerca de 20 nomes de seções e procedimentos individuais. Tudo isso está perfeitamente de acordo com os livros e monografias no campo, mas nada sobre TI para mineração de dados.


Esta é uma falha na estatística. A propósito, eu mesmo a utilizo.
 
alexeymosc:

E nós os desacreditamos. Há dois esquemas principais: estes são quantis (tornando o PDF igual) e espaçamento igual (o PDF é muito semelhante ao resultado sobre os dados brutos).

O número de caracteres é definido pelo pesquisador.

Isto é, se não soubermos o alfabeto do mercado, vamos criar um, e é isso que vamos estudar.

Eu poderia estar errado, é claro, e não raramente o faço, mas esta abordagem não me parece ser boa.

 
HideYourRichess:

Isto é, se não conhecemos o alfabeto do mercado, vamos inventá-lo e estudá-lo exatamente.

Eu poderia estar errado, é claro, e não raramente o faço, mas esta abordagem não me parece ser boa.


Veja, eu não quero discutir e não gosto disso, mas é isso que os pesquisadores fazem para as variáveis contínuas, eles as discretizam. Não há outra maneira, a alternativa é não aplicar a TI a variáveis contínuas.

Como fazer isso é um tópico à parte. Existe uma metodologia para determinar o número de caracteres de um alfabeto através da análise contínua da distribuição de valores (chamada Parzen Windows - regras do google...), mas não a usei neste caso e acho que perdi um pouco.

 
Você parece não ter entendido nada do que estava falando. Bem, boa sorte.
 
HideYourRichess:
Você parece não ter entendido nada do que estava falando. Bem, boa sorte.

Entendo seu raciocínio sobre a independência dos incrementos. Não tenho certeza se posso concordar completamente. Eu também consultaria a Mathemat sobre este assunto.
 
HideYourRichess:

Se você não envolve "economia e outros significados", então de que processos estamos falando? Um processo é um fenômeno "físico", tem causas e conseqüências. Por exemplo, o processo de queda de uma maçã na cabeça de Newton. Na aplicação aos mercados, o processo de compra e venda. Onde está tudo isso no mercado?

Próximo ponto. O ter.ver, no qual o ter.inf. se baseia, requer independência dos eventos em questão, ou símbolos. Caso contrário, o uso desses aparelhos matemáticos é incorreto. Onde está a independência inerente? Suponha que eu, a partir de intenções especulativas, compre algumas ações (quero dizer, o mercado real, não a corretora), e um retorno ocorra nos preços. Depois de um tempo, depois de algum tempo, decidi vender estas ações e outro retorno aconteceu. Estes dois eventos estão claramente ligados um ao outro através de mim e de meus impulsos especulativos. Como há muitos tolos como eu no mercado, e todos eles compram e vendem da mesma forma, todos os retornos acabam sendo vinculados - dependentes. Então, por que você está tentando aplicar um aparelho matemático a eventos dependentes de eventos independentes? É correto?

Sobre isto, tudo está longe de ser óbvio.


Neste caso, a independência não é necessária como eu a entendo, mas é precisamente o tema da avaliação.
 
Muitos exemplos de aplicação da TI, em russo, referem-se à análise dos alfabetos do russo e de outros idiomas, bem como à análise de palavras e frases (seqüências de palavras). E todos estes caracteres não são a priori estatisticamente independentes, e por estes exemplos são estimadas informações mútuas, um valor que mostra a quantidade de dependência. Portanto, a independência a priori dos valores em estudo não é um pré-requisito para a aplicação correta da TI.
Razão: