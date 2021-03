Ce site peut gagner des commissions d’affiliation à partir des liens sur cette page. Conditions d’utilisation.

Au cours des dernières années, l’IA est passée d’un sujet de niche à un domaine en pleine explosion. L’IA peut améliorer la qualité audio et vidéo, animer des images fixes de personnes décédées depuis longtemps et vous identifier à partir d’une empreinte analogique. Une chose qu’il n’a pas pu faire? Argumentez efficacement dans le cadre d’un débat formel.

Pour surmonter ce problème, IBM a créé Project Debater, un programme de développement d’IA axé sur exactement ce à quoi il ressemble. De nombreux projets d’IA, en particulier ceux axés sur le jeu, ont clairement un gagnant et un perdant en fonction de l’évaluation de critères numériques, tels que les pièces capturées, les vies perdues ou le rapport entre les victimes et les décès. Débattre efficacement d’un humain nécessite un ensemble de compétences très différentes.

Un article récent dans La nature décrit les résultats d’un test de 2019 entre le Project Debater et le champion du débat mondialement reconnu Harish Natarajan. L’IA et l’individu ont débattu de la question de savoir si l’école maternelle devrait être subventionnée. Chaque partie a eu 15 minutes pour le temps de préparation sans accès Internet supplémentaire, que Project Debater a utilisé pour trier sa propre base de données interne de contenu. Les deux parties ont prononcé un discours de quatre minutes, suivi d’une déclaration de clôture de deux minutes.

En fin de compte, Natarajan a été jugé avoir gagné le débat, mais le Project Debater a tenu bon, formant des déclarations et des arguments logiques au cours de la discussion.

Les chercheurs qui ont développé Project Debater ne peuvent pas le comparer avec d’autres systèmes de ce type. Il n’y en a pas. Au lieu de cela, ils ont utilisé PD pour générer un seul discours d’ouverture et l’ont comparé à diverses autres méthodes.

Dans le graphique ci-dessous, «Summit» est un système de résumé multi-document, Speech-GPT2 est un «modèle de langage finement réglé» et Arg-GPT2 a été généré à l’aide d’arguments de concaténation. Arg-Search fait référence aux discours extraits à l’aide d’ArgumenText. Arg-Human1 et Arg-Human2 font référence à une approche hybride qui a testé le module d’exploration d’arguments de Project Debater aux côtés de la paternité et de la vérification humaines. Enfin, des discours d’experts humains ont été inclus.

Le graphique ci-dessus montre le score de base où un score de 5 indique «Tout à fait d’accord» et un score de 1 signifie «Pas du tout d’accord». Les lecteurs ont été invités à répondre à la question suivante: «Ce discours est un bon discours d’ouverture sur ce sujet.» Ce graphique n’est pas un test complet des capacités de Project Debater – il évalue uniquement les discours d’ouverture – mais il démontre que le système est capable de produire des arguments cohérents. IBM a un site Web pour le projet avec des liens vers le livre blanc, le podcast et le débat de 2019 sur les subventions préscolaires si vous souhaitez en savoir plus sur le fonctionnement du système.

La question de savoir qui gagne un débat sera toujours subjective, et les humains surpassent toujours clairement le Project Debater d’IBM. Pour l’instant, nous sommes encore loin de Data, mais nous avons également parcouru un long chemin depuis Eliza.

Maintenant lis: