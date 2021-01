Facebook a rendu public le fonctionnement de son système pour reconnaître le contenu de l’image grâce à l’intelligence artificielle. Selon l’entreprise, le but principal de l’utilisation de cette technologie est de permettre aux personnes ayant des problèmes d’accessibilité d’entendre une description de ce qui se trouve sur la photo, même sans qu’il y ait un texte alternatif écrit par l’utilisateur qui lui est associé.

Ils expliquent de la même manière comment, depuis 2016, Facebook dispose d’une technologie de texte alternatif automatique (AAT), capable de générer des descriptions pour les photographies. Avec l’explication, vient la nouvelle que la dernière version de ce système AAT vient de recevoir des mises à niveau majeures pour la reconnaissance d’image.

C’est ainsi que Facebook sait ce qu’est une photo, même si nous ne lui communiquons pas ces données

AAT (Alternative Automatic Text) est une technologie Facebook qui permet reconnaître des objets dans une image. Un réseau neuronal est utilisé, selon Facebook, formé avec des millions de paramètres et d’exemples. De cette manière, le réseau de neurones est capable de savoir s’il y a ou non des personnes sur une photo, combien il y en a, les objets présents, les animaux, etc.

ATT est capable de reconnaître pratiquement n’importe quelle scène, et même de nous dire à quelle distance chaque personne se trouve sur la photo

Tel est le système d’IA que Facebook a mis en place qui reconnaît même les environnements, en étant capable de dire si la photo est prise à l’intérieur, à l’extérieur, dans un monument spécifique, pratiquement toutes les situations peuvent être reconnues.

Facebook a amélioré cette technologie, étant même capable de détecter la taille relative des objets. En d’autres termes, ATT est capable de vous dire qu’il y a une image avec cinq personnes, l’une au centre, les autres sur les côtés et une autre derrière, analysant la position de chacune d’elles par rapport à la position qu’elles occupent dans l’espace.

ATT, dans sa première phase de développement, a pu reconnaître 100 concepts, comme «arbre», «montagne», «plein air», etc., tous très simples. Aujourd’hui, il existe plus de 1200 concepts reconnus par le réseau de neurones, et c’est qu’ils utilisent des données d’applications telles qu’Instagram. Facebook reconnaît que son modèle est formé avec des images publiques de Facebook et d’Instagram, en utilisant leurs hashtags. Grâce à cette gigantesque base de données, il est capable de reconnaître les tons de peau, le sexe, les événements tels que les mariages (par les vêtements que les utilisateurs portent), les types de nourriture, etc.

Bien que Facebook assure que ce réseau de neurones est destiné à aider les personnes ayant une déficience visuelle, il est toujours frappant la quantité de données que vous collectez pour savoir exactement ce qu’il y a dans chaque photo.

