Vision par ordinateur: une porte vers le future

Dans cet article, notre expert explique comment fonctionne la vision par ordinateur et donne des exemples de comment les machines voient les images.

SEPTEMBER 14, 2021

12:00 AM

Par Linge Xie

Le phénomène qui permet aux machines telles que les ordinateurs ou les téléphones portables de voir ce qui les entoure est connu sous le nom de “computer vision” ou “vision par ordinateur” en français. Dès les années 50, des travaux visant à recréer un oeil humain avait été entrepris, et depuis de nouvelles avancées ont été faites. En effet, la vision par ordinateur se retrouve maintenant dans nos téléphones portables via différentes applications de commerce électronique ou de caméra.

Mais comment la vision par ordinateur fonctionne?

Travailler sur la vision par ordinateur équivaut à effectuer des millions de calculs en un clin d’œil avec une précision presque identique à celle de l’œil humain. En effet, il ne s’agit pas seulement de convertir une image en pixels et d’essayer ensuite de donner un sens à ce qui se trouve dans l’image à travers ces pixels, mais de commencer par comprendre l’image de façon globale. Ensuite, vous allez pouvoir extraire des informations de ces pixels et comprendre ce qu’ils représentent.

Il existe plusieurs façon de comment les machines perçoivent les images:

  • Comprendre les couleurs comme des nombres: Dans les ordinateurs, chaque couleur a été programmée pour être représentée par une valeur hexadécimale. Cela diffère des humains, qui ont une compréhension naturelle des différentes nuances.
  • Segmentation d’images: Les ordinateurs sont faits pour regrouper les pixels ayant des couleurs similaires. C’est ce qu’on appelle la segmentation de l’image. Les pixels proches les uns des autres ont tendance à avoir des valeurs de couleurs représentées en hexadécimal très similaires, les regrouper peut aider les machines à mieux comprendre les images. Par exemple, le premier plan et l’arrière-plan.
  • Trouver les coins: Après la segmentation des images, les images sont ensuite recherchées pour certaines caractéristiques, également appelées coins. En d’autres termes, les machines recherchent des lignes qui se rencontrent à un angle et qui couvrent une partie spécifique de l’image avec une seule nuance de couleur.
  • Trouver les textures: Un autre aspect important pour identifier correctement toute image est de déterminer les textures dans une image. La différence de textures entre deux objets permet à une machine de catégoriser plus facilement un objet correctement.
  • Tirer une conclusion: Après avoir suivi les différentes étapes ci-dessus, la machine est chargée de faire une estimation proche de la vérité pour classer l’image donnée dans une catégorie et la faire correspondre à celles présentes dans la base de données.

L’évolution de la vision par ordinateur

Depuis l’amélioration des réseaux neuronaux en 2012, la vision par ordinateur est aujourd’hui principalement impliquée dans les discussions sur le deep learning. En effet, avec la puissance du deep learning, la vision par ordinateur a réussi à s’immiscer dans notre vie quotidienne.

Par exemple, les algorithmes de reconnaissance faciale ont été utilisés dans le monde entier pour le déverrouillage des téléphones. À l’avenir, il y aura d’autres mises en œuvre révolutionnaires qui affecteront le monde.

Linge Xie – Consultant RS&DE

Notre auteur

Linge Xie

Linge Xie

Consultant RS&DE

Insights complémentaires