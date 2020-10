Nvidia a annoncé une nouvelle plate-forme de visioconférence pour les développeurs nommée Nvidia Maxine qui, selon elle, peut résoudre certains des problèmes les plus courants dans les appels vidéo.

Maxine traitera les appels dans le cloud à l’aide des GPU de Nvidia et améliorera la qualité des appels de plusieurs manières à l’aide de l’intelligence artificielle. Grâce à l’IA, Maxine peut réaligner les visages et les regards des appelants pour qu’ils regardent toujours directement leur caméra, réduire la bande passante requise pour les appels jusqu’à 90% en ne transmettant que les «points faciaux clés» et augmenter la résolution des vidéos. Les autres fonctionnalités disponibles dans Maxine incluent le ré-éclairage du visage, la traduction et la transcription en temps réel et les avatars animés.

La fonction d’alignement du visage de Nvidia vous assurera que vous regardez toujours la caméra

Bien entendu, toutes ces fonctionnalités ne sont pas nouvelles. La compression vidéo et la transcription en temps réel sont assez courantes, et Microsoft et Apple ont introduit l’alignement du regard dans la Surface Pro X et FaceTime pour garantir que les gens gardent un contact visuel pendant les appels vidéo (bien que les fonctionnalités d’alignement du visage de Nvidia ressemblent à une version beaucoup plus extrême. de cela).

Mais Nvidia espère sans aucun doute que son influence dans le cloud computing et ses impressionnants travaux de R&D en IA l’aideront à dépasser ses concurrents. Le vrai test, cependant, sera de voir si des sociétés de visioconférence établies adoptent réellement la technologie de Nvidia. Maxine n’est pas une plate-forme grand public mais une boîte à outils permettant aux entreprises tierces d’améliorer leurs propres logiciels. Jusqu’à présent, Nvidia n’a annoncé aucun partenaire qui utiliserait Maxine à l’avenir, bien qu’il affirme être «en discussion» avec beaucoup d’entre eux. Comme indiqué dans l’image ci-dessous, tous les principaux fournisseurs de cloud proposent Maxine dans le cadre de leurs services cloud Nvidia GPU.

Les fonctionnalités basées sur l’IA disponibles pour Nvidia Maxine incluent la compression AI, l’alignement du visage et la super résolution Image: Nvidia

Lors d’une conférence téléphonique avec des journalistes, le directeur général des médias et du divertissement de Nvidia, Richard Kerris, a décrit Maxine comme «une annonce vraiment excitante et très opportune», et a souligné sa compression vidéo alimentée par l’IA comme une fonctionnalité particulièrement utile.

«Nous avons tous connu des moments où la bande passante a été une limitation dans nos conférences que nous faisons quotidiennement ces jours-ci», a déclaré Kerris. «Si nous appliquons l’IA à ce problème, nous pouvons reconstruire les scènes de différence aux deux extrémités et ne transmettre que ce qui doit être transmis, réduisant ainsi considérablement cette bande passante.»

Nvidia affirme que sa fonction de compression utilise une méthode d’IA connue sous le nom de réseaux antagonistes génératifs ou GAN pour reconstruire partiellement les visages des appelants dans le cloud. C’est la même technique utilisée dans de nombreux deepfakes. «Au lieu de diffuser l’intégralité de l’écran de pixels, le logiciel d’IA analyse les principaux points du visage de chaque personne lors d’un appel, puis réanime intelligemment le visage dans la vidéo de l’autre côté», a déclaré la société dans un article de blog. «Cela permet de diffuser des vidéos avec beaucoup moins de données circulant sur Internet.»

Comme toujours avec ces premières annonces, nous devrons voir plus de cette technologie en action et attendre les accords de partenariat conclus par Nvidia avant de savoir quel effet cela aura sur les appels vidéo quotidiens. Mais l’annonce de Nvidia montre à quel point l’avenir de la visioconférence sera plus artificiel que jamais, avec l’IA utilisée pour redresser votre regard et même reconstruire votre visage, le tout au nom de l’économie de bande passante.