Pendant la Seconde Guerre mondiale, les Alliés ont utilisé les statistiques pour estimer la production allemande de chars.

En utilisant les numéros des châssis, moteurs des chars capturés ou détruits, roues et pneus, il a été possible de reconstituer la séquence de production de ces engins.

Les chars allemands peuvent être numérotés 1, 2, 3… N, où N est le nombre total de chars. Le but est donc d’estimer N. Pour cela, les statisticiens ont utilisé les prises de guerre. Prenons un exemple : vous avez cinq numéros de chars, qui sont 30, 51, 43, 92 et 26. On note k la taille de l’échantillon (ici, k = 5) et m la plus grande valeur (ici, m = 92). Alors un « bon » estimateur du nombre N de chars est N* = m – 1 + m/k. Dans notre exemple, on a donc N* = 92 – 1 + 92/5 = 109,4, c’est-à-dire environ 109 chars.

Il s’agit d’une estimation ponctuelle, c’est-à-dire de la valeur « la plus probable » pour N à partir d’un échantillon de taille k. Avec une probabilité de 95 %, le nombre inconnu N est inférieur à 20 m1/k. La précision de l’estimateur N* augmente vite avec la taille de l’échantillon k dont on dispose : la borne vaut 20m pour k = 1 mais seulement 1,35m pour k = 10.