Les bases de données pour décrire le monde

Gilles Cohen



Culturomics, le numérique et la culture

JP DELAHAYE & N GAUVRIT
Odile Jacob
2013
224 pages
22.9 €

Acheter ce livre



Les sciences sociales vont-elles se résumer à l’étude de graphiques issus des statistiques de Google ? C’est ce que laisse craindre, même si le discours des auteurs est rassurant, l’ouvrage Culturomics récemment publié aux éditions Odile Jacob par deux mathématiciens de talent, Nicolas Gauvrit, spécialiste des applications de notre discipline à la psychologie, et Jean-Paul Delahaye, bien connu des lecteurs de Tangente.

Le point de départ est l’initiative de Google consistant à numériser plus de cinq millions de volumes parus entre 1800 et nos jours, initiative accompagnée de technologies statistiques permettant de disposer de graphiques représentant l’usage de mots ou groupes de mots dans des cadres divers : temporels, géographiques, thématiques. Les conclusions ? Elles vont de la description des préoccupations d’une société donnée à une époque donnée jusqu’à l’évaluation de la notoriété d’un personnage, en passant par le classement qualitatif, par exemple des grands mathématiciens.

Ce n’était probablement pas l’intention des auteurs, mais la lecture de ce livre sensibilise aux failles de cette méthode, vulnérable aux imprécisions liées à la saisie des données, mais aussi aux trucages et aux manipulations qui, appliqués à des sujets sensibles, peuvent avoir des conséquences qui font froid dans le dos.



Les dernières notes de lecture