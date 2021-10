L’adoption de la réalité augmentée se fait lentement mais sûrement, et il est facile de voir un avenir possible pour la technologie : du matériel qui vous permet de modifier ce que vous voyez en temps réel, en remplaçant les objets autour de vous par des superpositions virtuelles. Appelez cela la réalité mixte, pour être plus précis.

Des recherches récentes de l’équipe d’IA de Porsche (oui, les constructeurs automobiles – nous y reviendrons dans un instant) montrent comment cela pourrait fonctionner. L’équipe a construit un système d’IA baptisé TransforMR qui détecte les objets comme les voitures et les personnes, les supprime, puis les remplace par des alternatives CGI en temps réel. Les résultats finaux ne sont guère irréprochables (les modifications sont aléatoires et les modèles CGI semblent avoir été empruntés à 3D Movie Maker) mais le concept est frappant. Il n’est pas difficile d’imaginer que des applications comme celle-ci deviennent monnaie courante dans les décennies à venir.

C’est une démo grossière, mais le concept est frappant

L’équipe à l’origine du travail a déclaré à The Verge que bien que des éléments individuels de leur travail aient été effectués auparavant, le système composite est nouveau. TansforMR peut fonctionner sur les smartphones et tablettes classiques, mais nécessite une connexion 4G pour envoyer des données vers le cloud. Les images sont traitées de manière à ce que les objets ne soient pas simplement recouverts, comme avec les objectifs Snapchat AR ou les Memoji d’Apple, mais entièrement édités. Les objets sont détectés, segmentés, puis « repeints » (remplacés par un arrière-plan généré par l’IA) et un modèle CGI se substitue à l’original.

Le modèle TransformMR comporte de nombreuses étapes distinctes.

Il y a évidemment beaucoup de points à améliorer. La fréquence d’images n’est que de 15 images par seconde avec une peinture de faible qualité ; le décalage est de 50 à 100 millisecondes ; et les remplacements CGI ne sont pas de la meilleure qualité. Mais, l’équipe derrière le système dit que ces aspects sont relativement faciles à améliorer.

« La principale limitation est que les grandes images sont très gourmandes en calcul », a déclaré Mohamed Kari, chercheur en apprentissage automatique chez Porsche, à The Verge. « Donc, pour l’inpainting, nous le faisons actuellement avec de très petites images, fonctionnant sur des images 512 x 512. Mais la bande passante [usage] est négligeable. Si vous pouvez faire FaceTime, vous pouvez faire TransformMR.

L’un des éléments clés du système, explique Kari, est son utilisation de la détection de pose. Cela signifie que lorsque le système détecte une personne, par exemple, il identifie 18 articulations distinctes dans le corps. Cela signifie que le remplacement CGI peut être ancré au mouvement de la cible en temps réel. Kari compare cela à d’autres systèmes AR qui identifient simplement des surfaces géométriques.

Intégrer cette technologie dans les lunettes AR est impossible pour le moment

En regardant des extraits de TransforMR en action, il n’est pas difficile d’imaginer qu’un tel logiciel soit intégré dans des lunettes AR. Les utilisateurs pouvaient choisir un «thème» pour leur journée, en remplaçant les voitures, les bâtiments et les personnes par des alternatives de science-fiction ou des objets tirés de la nature. Mais, comme le souligne Kari, cela impliquerait un énorme défi matériel. Les lunettes de réalité augmentée actuelles ne peuvent projeter que des superpositions semi-opaques à faible résolution sur leurs lentilles. À l’heure actuelle, nous n’avons tout simplement pas la technologie pour « éditer » ce que les utilisateurs voient avec ce type de matériel. (Bien que cela puisse vraisemblablement être fait à l’aide d’un système de réalité virtuelle « passthrough », où les caméras à la première personne diffusent un flux vidéo en direct sur des écrans qui obstruent complètement la vision du porteur.)

« Nous reproduisons l’image complète à l’écran, nous pouvons donc supprimer tout ce que nous voulons, mais avec des lunettes de réalité augmentée, il est difficile de supprimer des objets car cela ajoute de l’intensité lumineuse », explique Kari. « Dans HoloLens, par exemple, vous regardez à travers la vitre, il est donc plus difficile de retirer des objets. Cette question est ouverte à la recherche.

Mais pourquoi Porsche étudie-t-il ce genre de technologie en premier lieu ? Selon l’un des architectes de l’IA de l’entreprise, Tobias Grosse-Puppendahl, il s’agit d’améliorer l’expérience des passagers et des conducteurs. Les futures versions du logiciel TransforMR pourraient être utilisées pour divertir les gens lorsqu’ils sont coincés dans la circulation, a déclaré Grosse-Puppendahl à The Verge. « Notre principale question était : comment pouvons-nous modifier la réalité d’une manière amusante et divertissante avec laquelle réagir ? Et c’est de là qu’est née notre idée.

D’autres projets de recherche chez Porsche suivent un thème similaire. Par exemple, la société a également construit un prototype de système appelé SoundRide qui utilise la vision industrielle d’une voiture pour détecter les changements de paysage et sélectionner la musique appropriée. « Peut-être, par exemple, que vous conduisez à travers les Alpes, que vous conduisez sur une belle route, et tout à coup vous avez une vue magnifique et peut-être que la musique change », explique Kari. « Nous réfléchissons à la façon dont la technologie peut rendre l’expérience dans la voiture encore plus intéressante et belle. » Et cela signifie bricoler avec ce que les gens verraient et entendraient autrement.