Aos especialistas na teoria da probabilidade. Eu tenho uma carteira de 10 ações. Qual é a probabilidade de 2 das minhas 10 empresas entrarem em falência no próximo ano? - página 5

 
Nikolai Semko:

Não é forte em R.

Explique os seguintes pontos:

k<- 0:n é um vetor de quantis. Você pode dar uma decifração deste conceito?

o segundo valor é o número de empresas falidas (deveria ser 50), então por que você adiciona o vetor k a 50?

O terceiro valor é o número de empresas não falidas (deve ser 4950). Você tem 4950-n+k ?

O quarto valor é o número de ações = 10. Tudo parece estar bem aqui.

R online

k é um vetor de valores possíveis para o número de falências no segundo ano: 0, 1, ... , 9, 10.

n-k é um vetor de 10, 9, ..., 1, 0 (característica R)

Número total de bolas 5010 = 5000 + 10

o número total de falências não é 50, mas 50+k, não 4950-n+k (aqui k não é mais um vetor, mas um número desconhecido de 0 a 10)

Você assume que no segundo ano temos 5000 empresas, das quais 50 também irão à falência. Isto não é correto. Tudo o que sabemos é que temos a mesma probabilidade de falência do ano passado - pode bem haver 49 ou 52 falências por 5000 (a probabilidade de haver exatamente 50 por 5000 dois anos seguidos é muito pequena).

compile R online
  • rextester.com
compile R online
 
Aleksey Nikolayev:

R online

k é um vetor de valores possíveis para o número de falências no segundo ano: 0, 1, ... , 9, 10.

n-k é um vetor de 10, 9, ..., 1, 0 (característica R)

Número total de bolas 5010 = 5000 + 10

o número total de falências não é 50, mas 50+k, não 4950-n+k (aqui k não é mais um vetor, mas um número desconhecido de 0 a 10)

Você assume que no segundo ano temos 5000 empresas, das quais 50 também irão à falência. Isto não é correto. Tudo o que sabemos é que temos a mesma probabilidade de falência do ano passado - pode bem haver 49 ou 52 falências por 5000 (a probabilidade de dois anos seguidos ser exatamente 50 por 5000 é muito pequena).

Mais uma vez, repito. As condições do problema estão longe de ser práticas. Não é preciso acrescentar termos ao problema à medida que se vai avançando. Eu também tive a primeira idéia de fazer muitas perguntas importantes ao autor do tópico, mas percebi que não há necessidade de complicar as coisas. A questão é bastante específica, embora longe da prática.

Obrigado pelo link. Eu entendi R. É muito mais simples. Os resultados são os mesmos que os meus:

p0 <- dhyper(0,50, 4950,10)
p1 <- dhyper(1,50, 4950,10)
p2 <- dhyper(2,50, 4950,10)
p0; p1; p2

O resultado:

p0 = 0.9042998
p1 = 0.09150979
p2 = 0.004082944

Meus cálculos acima:

P1 = (50!*4950!*10!*4990!)/(49!*9!*4941!*5000!) = (50*4950*4949*4948*4947*4946*4945*4944*4943*4942*10)/(5000*4999*4998*4997*4996*4995*4994*4993*4992*4991) = 0.09150979127569519373319974384113

A probabilidade de falência é exatamente 2 em cada 10 empresas:

P2 = (50!*4950!*10!*4990!)/(2*48!*8!*4942!*5000!) = (49*50*4950*4949*4948*4947*4946*4945*4944*4943*9*10)/(2*5000*4999*4998*4997*4996*4995*4994*4993*4992*4991) =0.00408294394502039462124049848583

HZ notou imediatamente que você tem algo errado, porque neste caso, a probabilidade não pode ser igual a 1, ela deve ser inferior a 1.

E a modelagem desta situação confirmou estes números.

#define  total 10000000
void OnStart() {
   int sum[total];
   MathSrand(GetTickCount());
   for (int j=0; j<total; j++) {
      sum[j]=0;
      int b[10];
      for (int i=0; i<10; i++) {
         int r=35000;
         while (r>=30000) r=rand();
         b[i]=r%5000;
         if (b[i]<50) sum[j]++;
      }
      ArraySort(b);
      for (int i=0; i<9; i++) if (b[i]==b[i+1]) {
            j--;
            break;
         }
   }
   int s0=0,s1=0,s2=0;
   for (int j=0; j<total; j++) {
      if (sum[j]==0) s0++;
      if (sum[j]==1) s1++;
      if (sum[j]==2) s2++;
   }
   Print("Вероятность без банкротства - "+string(double(s0)/total)+"; Вероятность 1 банкротства - "+string(double(s1)/total)+";  Вероятность 2 банкротств -   "+string(double(s2)/total));
}
2020.01.06 10:52:56.474 TestDouble (.BrentCrud,H1)      Вероятность без банкротства - 0.9043109; Вероятность 1 банкротства - 0.0914961;  Вероятность 2 банкротств -   0.0040885
2020.01.06 10:53:10.916 TestDouble (.BrentCrud,H1)      Вероятность без банкротства - 0.9042554; Вероятность 1 банкротства - 0.0915793;  Вероятность 2 банкротств -   0.0040546
2020.01.06 10:53:16.937 TestDouble (.BrentCrud,H1)      Вероятность без банкротства - 0.9043432; Вероятность 1 банкротства - 0.0914806;  Вероятность 2 банкротств -   0.0040718
2020.01.06 10:53:22.539 TestDouble (.BrentCrud,H1)      Вероятность без банкротства - 0.9042999; Вероятность 1 банкротства - 0.0915289;  Вероятность 2 банкротств -   0.0040653

 
Aleksey Nikolayev:

Este é precisamente o caso em que se pode tirar proveito da proximidade da distribuição hiper-hiométrica com a distribuição binomial. A imprecisão resultante é muito menor do que a imprecisão associada à aproximação do modelo (desigualdade de probabilidades de falência de diferentes empresas, a relação entre falências, etc.).

Uma distribuição binomial requer a probabilidade de ser independente. Neste caso, a probabilidade é dependente.

 
Nikolai Semko:

Uma distribuição binomial requer a probabilidade de ser independente. Neste caso, a probabilidade é dependente.

Não existe tal coisa como "probabilidade independente" em um teórico, existem eventos independentes.

O modelo que você usou não se encaixa (ou melhor, encaixa apenas aproximadamente). Se você não entender, esse é o seu problema.
 
Aleksey Nikolayev:

Não existe tal coisa como "probabilidade independente" em um teórico, existem eventos independentes.

Eu concordo. Soa melhor assim.
Sim, eu sou fraco em terminologia. E eu tenho um conhecimento amador da Teoria da Probabilidade, para ser honesto.

 
Nikolai Semko:

Eu concordo. Soa melhor assim.
Sim, eu sou fraco em terminologia. E em geral tenho conhecimentos amadores na Teoria da Probabilidade, para ser honesto.

não vamos falar de "seus" amadores, porque estou cansado de polvilhar "nossa" cabeça com cinzas

e que conhecimento cósmico Alexey tem em quase tudo... Só tenho que levantar a mão com espanto.

 
Maxim Dmitrievsky:

Não vamos falar de "seus" amadores, porque estou cansado de polvilhar "nossa" cabeça com cinzas

e que conhecimento cósmico Alexey tem em quase tudo... Só tenho que levantar as mãos em espanto...

:)
Sim, não, estou falando sério. É mais uma coisa intuitiva e em movimento.

 
Maxim Dmitrievsky:

Não vamos falar de "seus" amadores, porque estou cansado de polvilhar "nossa" cabeça com cinzas

e que conhecimento cósmico Alexey tem em quase tudo... Eu só posso me maravilhar com minhas mãos erguidas em maravilha.

Como Matroskin disse em um caso semelhante: "Eu também posso bordar... E em uma máquina de escrever...") )

 
Nikolai Semko:

:)
Sim, não, estou falando sério. Sou mais intuitivo e do tipo "on the fly".

O MIT tem um bom curso teórico no youtube.

 
igrok333:
No ano passado, 50 de 5.000 empresas faliram no mercado americano. Portanto, a probabilidade de uma empresa ir à falência é de 1/100.

Eu tenho uma carteira de 10 ações.

Qual é a probabilidade de que 1 das minhas 10 empresas vá à falência em um ano? É fácil de calcular.
A probabilidade de uma empresa ir à falência é de 1/100. E nós aceitamos 10 empresas, então aumentamos as chances do evento ocorrer por um fator de 10.
Assim, obtemos a probabilidade: 1/100 * 10 = 1/10.

Qual é a probabilidade de 2 das minhas 10 empresas falirem em um ano? Como calculamos isso?

foi apenas uma citação completa do tópico. Sublinha o que é uma condição e observa o que é relevante para a área temática

Onde você vê as probabilidades condicionais aqui? Não há nenhuma. Há estatísticas do ano passado.

não há sequer um número total de empresas no momento do investimento, é desconhecido e, a propósito, sem importância.

PS/ nem mesmo surpreso que tratores lavram o oceano e GAs batem ao acaso :-)

Razão: