对概率论的专家。我有一个10只股票的投资组合。我的10家公司中,有2家明年会破产的概率是多少? - 页 5

 
Nikolai Semko:

在R方面不强。

解释一下以下几点。

k<- 0:n 是一个量纲的向量。你能对这个概念进行解读吗?

第二个值是破产公司的数量(应该是50),那么你为什么要把向量k加到50?

第三个值是非破产公司的数量(应该是4950)。你有4950-n+k吗?

第四个值是股票数量=10。这里的一切似乎都很好。

R在线

k是第二年破产数量的可能值的向量:0,1,...。, 9, 10.

n-k是一个10,9,...,1,0的向量(特征R)。

球的总数 5010 = 5000 + 10

破产总数不是50,而是50+k,不是4950-n+k(这里k不再是一个向量,而是一个从0到10的未知数)。

你假设在第二年我们有5000家公司,其中50家也会破产。这是不正确的。我们所知道的是,我们的破产概率与去年相同--每5000人中很可能有49或52起破产(连续两年每5000人中正好有50起的概率非常小)。

compile R online
  • rextester.com
compile R online
 
Aleksey Nikolayev:

R在线

k是第二年破产数量的可能值的向量:0,1,...。, 9, 10.

n-k是一个10,9,...,1,0的向量(特征R)。

球的总数 5010 = 5000 + 10

破产总数不是50,而是50+k,不是4950-n+k(这里k不再是一个向量,而是一个从0到10的未知数)。

你假设在第二年我们有5000家公司,其中50家也会破产。这是不正确的。我们所知道的是,我们的破产概率与去年相同--每5000人中很可能有49或52起破产(连续两年正好是每5000人中有50起的概率非常小)。

我再次重申。问题的条件远非实际。你不需要边走边给问题添加术语。我也曾有过第一个想法,向该主题的作者提出很多引导性的问题,但我意识到没有必要将事情复杂化。这个问题很具体,虽然离实践很远。

谢谢你的链接。我已经理解了R。这就简单多了。其结果与我的相同。

p0 <- dhyper(0,50, 4950,10)
p1 <- dhyper(1,50, 4950,10)
p2 <- dhyper(2,50, 4950,10)
p0; p1; p2

其结果是。

p0 = 0.9042998
p1 = 0.09150979
p2 = 0.004082944

我的上述计算结果。

P1 = (50!*4950!*10!*4990!)/(49!*9!*4941!*5000!) = (50*4950*4949*4948*4947*4946*4945*4944*4943*4942*10)/(5000*4999*4998*4997*4996*4995*4994*4993*4992*4991) = 0.09150979127569519373319974384113

破产的概率正好是10家公司中的2家。

P2 = (50!*4950!*10!*4990!)/(2*48!*8!*4942!*5000!) = (49*50*4950*4949*4948*4947*4946*4945*4944*4943*9*10)/(2*5000*4999*4998*4997*4996*4995*4994*4993*4992*4991) =0.00408294394502039462124049848583

HZ马上注意到你有问题,因为在这种情况下,概率不可能等于1,它必须小于1。

而对这种情况进行建模,证实了这些数字。

#define  total 10000000
void OnStart() {
   int sum[total];
   MathSrand(GetTickCount());
   for (int j=0; j<total; j++) {
      sum[j]=0;
      int b[10];
      for (int i=0; i<10; i++) {
         int r=35000;
         while (r>=30000) r=rand();
         b[i]=r%5000;
         if (b[i]<50) sum[j]++;
      }
      ArraySort(b);
      for (int i=0; i<9; i++) if (b[i]==b[i+1]) {
            j--;
            break;
         }
   }
   int s0=0,s1=0,s2=0;
   for (int j=0; j<total; j++) {
      if (sum[j]==0) s0++;
      if (sum[j]==1) s1++;
      if (sum[j]==2) s2++;
   }
   Print("Вероятность без банкротства - "+string(double(s0)/total)+"; Вероятность 1 банкротства - "+string(double(s1)/total)+";  Вероятность 2 банкротств -   "+string(double(s2)/total));
}
2020.01.06 10:52:56.474 TestDouble (.BrentCrud,H1)      Вероятность без банкротства - 0.9043109; Вероятность 1 банкротства - 0.0914961;  Вероятность 2 банкротств -   0.0040885
2020.01.06 10:53:10.916 TestDouble (.BrentCrud,H1)      Вероятность без банкротства - 0.9042554; Вероятность 1 банкротства - 0.0915793;  Вероятность 2 банкротств -   0.0040546
2020.01.06 10:53:16.937 TestDouble (.BrentCrud,H1)      Вероятность без банкротства - 0.9043432; Вероятность 1 банкротства - 0.0914806;  Вероятность 2 банкротств -   0.0040718
2020.01.06 10:53:22.539 TestDouble (.BrentCrud,H1)      Вероятность без банкротства - 0.9042999; Вероятность 1 банкротства - 0.0915289;  Вероятность 2 банкротств -   0.0040653

 
Aleksey Nikolayev:

这正是人们可以利用超几何分布与二项分布接近 的情况。由此产生的不准确性比与模型的近似有关的不准确性要小得多(不同企业的破产概率不平等,破产之间的依赖性,等等)。

二项分布要求概率是独立的。在这种情况下,概率是依赖性的。

 
Nikolai Semko:

二项分布要求概率是独立的。在这种情况下,概率是依赖性的。

在理论家那里不存在 "独立的概率",有的是独立的事件。

你所使用的模型并不适合(或者说,只是大约适合)。如果你不理解,那是你的问题。
 
Aleksey Nikolayev:

在理论家那里不存在 "独立的概率",有的是独立的事件。

我同意。这样听起来更好。
是的,我在术语方面很弱。而且,说实话,我对概率论的了解也很业余。

 
Nikolai Semko:

我同意。这样听起来更好。
是的,我在术语方面很薄弱。说实话,我在概率论方面的知识总体上是业余的。

我们不要谈论 "你 "的业余生活,因为我已经厌倦了在 "我们 "的头上洒满灰烬。

和阿列克谢在几乎所有的事情上都有多大的宇宙知识......。我只得举起手来表示惊讶。

 
Maxim Dmitrievsky:

我们不要谈论 "你 "的业余生活,因为我已经厌倦了在 "我们 "的头上洒满灰烬。

和阿列克谢在几乎所有的事情上都有多大的宇宙知识......。我只有举起手来表示惊讶......。

:)
是的,不,我是认真的。更多的是一种直观的、随手可得的东西。

 
Maxim Dmitrievsky:

我们不要谈论 "你的 "业余的,因为我已经厌倦了用灰烬洒在 "我们 "的头上。

和阿列克谢在几乎所有的事情上都有多大的宇宙知识......。我只能举起双手惊叹不已。

正如马特鲁斯金在一个类似的案例中所说。"我还可以刺绣......。而在打字机上......"))

 
Nikolai Semko:

:)
是的,不,我是认真的。我更多地是凭直觉和随心所欲的那种人。

麻省理工学院在YouTube上有一个很好的理论家课程。

 
igrok333:
去年,美国市场 上5000家公司中有50家破产了。所以一个公司破产的概率是1/100。

我有一个10只股票的投资组合。

我的10家公司中有1家在一年内破产 的概率是多少?这很容易计算。
一个公司破产的概率是1/100。而我们采取了10家公司,所以我们将事件发生的几率提高了10倍。
所以我们得到的概率是:1/100*10=1/10。

我的10家公司中有2家在一年内破产 的概率是多少?我们如何计算呢?

这只是一个完整的主题引用。 强调了什么是条件,并指出了 与主题领域相关的内容。

你在哪里看到了条件概率? 没有任何条件。有去年的统计数据。

在投资时甚至没有一个公司的总数,它是未知的,顺便说一下,这并不重要。

PS/对于拖拉机耕作海洋和GA击败随机的情况都不感到惊讶:-)