Statistiques et probabilités revisitées


A. Albert, J. Bair et D. Justens

Les notions statistiques élémentaires de moyenne, d’écart type, de médiane et d’écart médian sont d’usage courant. On les rencontre à l’école, dans les médias, dans le monde professionnel… Elles peuvent toutes être construites à partir de distances usuelles, comme la distance euclidienne ou celle de Manhattan.

Statistique économique, finance, données du chômage, peu importe le contexte : sur le graphique ou sur l’écran que vous tenez entre les mains, les chiffres « tombent », les uns après les autres. Vous observez une série univariée, à savoir les valeurs d’une variable numérique unique mesurée (en euros, en heures, en pourcentages, en kilomètres, en degrés Celsius…) sur un certain nombre n d’individus issus d’une population homogène et constituant ce que l’on appelle un échantillon. L’ensemble des mesures effectuées peut être vu comme un point X dans un espace à n dimensions de coordonnées X = ( x1, x2xn ). Soit un point A du même espace ℝn dont toutes les coordonnées sont identiques, à savoir A = (a, aa).

Quelle est la distance d entre ces deux points ?

Si l’on prend en compte la distance euclidienne, on obtient bien entendu :

 

L’un des points A nous intéresse particulièrement : celui situé à la distance minimale du point X. Pour découvrir ses coordonnées, il suffit de considérer la fonction qui, au paramètre a, associe d 2 (a) et d’annuler sa dérivée première. 

Un calcul élémentaire nous livre :

 

C’est la moyenne arithmétique ... Lire la suite