[Archives] Mathématiques pures, physique, chimie, etc. : problèmes d'entraînement cérébral sans rapport avec le commerce. - page 383

 
Richie:

WWer, que signifie "taille de première base" ? La somme des membres ?

Le nombre d'éléments (nombres).
 
WWer:

Vous devez déterminer (de manière probabiliste (2sigma par exemple)) la taille de la première base à partir de la nouvelle base.

La taille est, si je comprends bien, la gamme des valeurs extrêmes, ou quoi ? Dans ce cas, si la distribution est connue, le problème peut être résolu.

Mais si la taille est un nombre de nombres, je ne le comprends pas. Donnez-moi un exemple, s'il vous plaît.

 
Mathemat:

La taille est, je suppose, l'écart entre les extrêmes, ou quoi ? Dans ce cas, avec une distribution connue, le problème peut être résolu.

Mais si la taille est un nombre de nombres, je ne comprends pas quelque chose. Donnez-moi un exemple, s'il vous plaît.


Prenons les nombres naturels pour simplifier : 1 2 3 4 5 ... X. C'est le "X" que nous devons trouver.

Choisissez au hasard un nombre dans cette base. Par exemple, "3"... la probabilité de choisir un nombre quelconque = 1/X.

Exemple. Supposons qu'il y ait 10 numéros : 1 2 3 4 5 6 7 8 9 10 (j'ai dit 10 pour l'exemple, en fait c'est le nombre que nous devons trouver)

Prenons un échantillon de 20 nombres : 5 2 9 5 3 8 4 10 3 2 7 1 8 5 2 6 1 10 1

Ici, maintenant oublions que nous avions la taille de la première base, et seulement à partir de la deuxième base nous devons la trouver.

Il est clair que la première base sera beaucoup plus grande et que les chiffres ne sont pas consécutifs.

 

Wow, est-ce que ce problème peut être résolu ?

Si les nombres de la première base ne se répètent pas, nous pouvons passer en revue les échantillons suivants et recalculer le nombre d'éléments (si le même nombre se répète dans ces échantillons, alors les répétitions ne sont pas prises en compte - il n'a été pris en compte qu'une seule fois, et les autres occurrences sont ignorées). Mais où est la garantie que la base de données originale ne contient pas plus d'éléments que ce que nous avons pu recalculer ? Une probabilité est une probabilité. Il faudrait faire beaucoup d'échantillons. Et le résultat ne sera que vérifié (peu importe le nombre d'échantillons que nous avons fait) - il y aura toujours une probabilité qu'au moins 1 élément ne soit pas inclus dans un échantillon.....

 

Honnêtement, je ne comprends pas l'idée. Et si les nombres sont des carrés de nombres naturels, c'est-à-dire 1, 4, 9, ..., 625 ? Quelle est la valeur de X ?

Et comment peut-on l'estimer à partir d'un "échantillon" qui est plus grand que la population initiale ?

Pouvez-vous faire allusion à une application pratique - à quoi cela sert-il ?

 
drknn:

Wow, est-ce que ce problème peut être résolu ?

Si les premiers nombres de base ne comportent pas de répétitions, vous pouvez passer aux sélections suivantes et recalculer le nombre d'éléments (si le même nombre de répétitions s'y trouve, alors les répétitions ne comptent pas - seule la première fois est comptée, et les occurrences ultérieures sont manquantes). Mais où est la garantie que la base de données originale ne contient pas plus d'éléments que ce que nous avons pu recalculer ? Une probabilité est une probabilité. Il faudrait faire beaucoup d'échantillons. Et le résultat ne sera que vérifié (peu importe le nombre d'échantillons que nous avons fait) - il y aura toujours une probabilité qu'au moins 1 élément ne soit pas inclus dans un échantillon.....

Oui, bien sûr que oui)


c'est pourquoi j'ai dit "de manière probabiliste".... donc la réponse devrait être quelque chose comme ceci : taille de la base 100000-110000 avec une probabilité de 97%.... et si nous faisons 300 000 échantillons, nous avons une probabilité de 95% de 90% de la base.

 
Mathemat:

Honnêtement, je ne comprends pas l'idée. Et si les nombres sont les carrés des nombres naturels, c'est-à-dire 1, 4, 9, ..., 625 ? Quelle est la valeur de X ?

Et comment puis-je l'estimer à partir d'un "échantillon" plus grand que la population initiale ?

Pouvez-vous donner un aperçu de l'application pratique - à quoi cela sert-il ?

J'envoie des requêtes au serveur, et en réponse je reçois 10 identifiants d'utilisateur aléatoires de la base de données. Ici, je voulais résoudre un tel problème en même temps, qui saurait combien au moins il y a d'ID, et combien de requêtes à envoyer).

zy. J'ai 400000 id maintenant.

 
WWer:

Bonjour, qui peut résoudre ce problème ?) :

Il existe une base de chiffres différents. Sélectionnez au hasard des chiffres dans cette base et formez une autre base (c'est-à-dire qu'il y a déjà des chiffres qui peuvent être répétés). Vous pouvez en sélectionner autant que vous le souhaitez, mais c'est une perte de ressources et de temps.

Vous devez déterminer (de manière probabiliste (2sigma par exemple)) la taille de la première base à partir de la nouvelle base.

+ Il serait également intéressant de calculer le nombre d'échantillons à réaliser pour obtenir au moins 90% de la première base.


MOJ de l'échantillon multiplié par 2
 
Prival:
déterminer les MCO de l'échantillon et multiplier par 2.
MCO de quoi ?
 
WWer:
MOS de quoi ?


vous avez sélectionné 100 numéros dans une base, si la base est numérotée de 1 à ..... X dans l'ordre. alors peut-être que *2 de ces 100 numéros seront X

La fonction matad. rnd(2000) génère un nombre aléatoire de 1 à 2000. Nous avons pris 100 valeurs i=0...100 et avons tout calculé avec elles. Bien sûr, le résultat ne sera pas exact, car cette statistique est un intervalle de confiance - vous pouvez aussi le calculer et en fonction de la précision vous voulez déterminer la bonne taille de l'échantillon

Raison: