Comment l'ordinateur trie des photos


Timothée Lacroix et Neil Zeghidour

L'exemple du tri automatique de fichiers conduit à une réflexion plus globale sur… l'apprentissage des réseaux de neurones. Vous avez toujours voulu « ouvrir le capot » de l'intelligence artificielle et savoir « comment ça marche » ? Vos photos de vacances et un peu de maths vont vous aider…

Après des vacances bien méritées, j’aimerais trier automatiquement mes photos en deux classes : celles qui ont été prises sur la plage, et les autres. On peut imaginer une solution simple à ce problème. Étant donné une image d’entrée, je peux compter les pixels de couleur jaune. Dans le système RVB, où la couleur d’un pixel est caractérisée par les quantités de rouge, de vert, et de bleu qui la composent, on peut par exemple tester si les valeurs de rouge et de vert sont « suffisamment élevées », et la valeur de bleu « suffisamment faible ». On espère ainsi que les images qui contiennent suffisamment de pixels de couleur jaune seront les photos de la plage.

Comment définir « suffisamment » ? On choisit un seuil, et si le nombre de pixels jaunes dans une image lui est supérieur, on la classe comme « plage », sinon on la classe comme « autre ». Cela définit une fonction de décision. Si le seuil utilisé est trop élevé, tous les fichiers qui dépasseront le seuil seront effectivement des photos de plages (car « très jaunes »), mais on risque de rejeter à tort des images de plage contenant relativement peu de sable, et dont la quantité de jaune ne dépassera pas le seuil. ... Lire la suite gratuitement