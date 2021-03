Les algorithmes n’échouent pas tout le monde de la même manière.

Les humains sont des décideurs imparfaits. Des décennies de recherche montrent que nous sommes mauvais avec les chiffres et facilement influencés par les préjugés cognitifs et sociaux qui opèrent sous notre conscience. Le racisme s’insinue toujours dans les décisions humaines concernant l’embauche, le logement et le crédit.

En conséquence, beaucoup d’entre nous sont tentés de penser qu’il vaut mieux que les machines fassent des inférences directement à partir des données. Mais cela s’avère être une hypothèse dangereuse, comme nous l’explorons dans cet épisode de Glad You Asked.

Les nombreux choix subjectifs que font les scientifiques des données lorsqu’ils sélectionnent et structurent les données d’entraînement peuvent augmenter ou réduire les préjugés raciaux dans les systèmes d’apprentissage automatique. Après tout, les ingénieurs sont des humains avec des préjugés et des angles morts comme tout le monde.

Pour d’autres ensembles de données, la discrimination historique et l’inégalité systématique coloreront les données, quelle que soit la diligence du processus de collecte. Les données sur la criminalité, par exemple, sont finalement dérivées des choix que font les agents des forces de l’ordre sur les quartiers à patrouiller et les personnes à arrêter. Tous les systèmes d’écriture IA sont formés sur des échantillons d’écriture humaine, qui reflètent les perspectives des groupes d’écriture dominants.

Mais même si nous supposons que les données sont impartiales, les systèmes d’apprentissage automatique sont conçus pour minimiser les taux d’erreur, et ils le feront sans aucun souci d’équité (sauf programmation contraire). Cela signifie qu’ils ont tendance à «se soucier» davantage de l’exactitude des groupes majoritaires (littéralement plus grands) que des minorités, dans la mesure où les groupes diffèrent sur un attribut prédictif.

Vous avez sûrement entendu dire que la corrélation n’est pas la causalité. Eh bien, les systèmes d’IA sont des machines de corrélation. Ils peuvent être exacts pour les mauvaises raisons. C’est donc une chose de les utiliser pour améliorer les prévisions météorologiques et les résultats de recherche; c’en est une autre de les déployer dans les décisions concernant la vie des êtres humains individuels.

Rien de tout cela ne veut dire que ces problèmes ne peuvent être surmontés. Certains modèles prédictifs peuvent être moins biaisés que le décideur du statu quo. Mais l’hypothèse selon laquelle ces systèmes sont nécessairement plus objectifs est clairement erronée. Et comme les systèmes d’IA sont à la fois opaques et hautement évolutifs, ils exigent un niveau de contrôle que nous n’avons même pas commencé à garantir.

Vous pouvez trouver cette vidéo et toutes les vidéos de Vox sur YouTube. Abonnez-vous pour en savoir plus.

Lectures complémentaires:

« Examiner le recadrage d’image basé sur la saillance » par Vinay Prabhu

Application de recadrage Gradio Saliency

«Disséquer les préjugés raciaux dans un algorithme utilisé pour gérer la santé des populations», Science

«Cartes modèles pour la création de rapports de modèles» ArXiv

Course après la technologie par Ruha Benjamin

Armes de destruction mathématique par Cathy O’Neil

L’algorithme éthique par Michael Kearns et Aaron Roth

«Pourquoi les algorithmes peuvent être racistes et sexistes», Recode

«Comment le Big Data est injuste» par Moritz Hardt

«Le problème des« données biaisées »» par Harini Suresh

«Impact Disparate du Big Data» par Solon Barocas et Andrew D. Selbst

«Équité dans la prise de décision algorithmique» par Mark MacCarthy