Google peut connaître le nom des chansons que vous fredonnez. Mais comment? C’est ainsi que fonctionne cette fonctionnalité spectaculaire.

Écrit par Christian Collado

Dernière mise à jour le 22/11/2020 à 21:01

Trouver le nom ou le créateur d’une chanson via Google est aussi simple que fredonner la chanson et attendre que le chercheur fasse sa magie. En quelques secondes – en fonction de votre technique de fredonnement – vous saurez Toutes les informations dont vous avez besoin À propos de cette musique qui joue dans ta tête depuis des jours.

Mais quelle est vraiment cette magie? À travers son blog sur l’intelligence artificielle, Google a voulu nous expliquer plus en détail comment fonctionnent leurs systèmes en charge d’identifier les chansons en fonction des sons que nous produisons.

Recherche Google Music

Google peut dire quelle chanson vous fredonnez.

Une base de données de millions de chansons et de nombreuses IA: c’est ainsi que fonctionne «Hum to search»

Google explique que lors du développement de cette fonctionnalité, appelée “Hum to Search”, ils ont dû faire face à plusieurs défis.

L’un des plus importants est le fait que chaque personne fredonne sa propre interprétation de la chanson, donc le rythme ou la hauteur peuvent ne pas être corrects, ce qui rend difficile la recherche de la chanson originale, en particulier lors de l’utilisation d’un base de données qui ne comprend que les versions originales de chaque chanson.

C’est pourquoi Google a décidé modéliser un système capable de produire une mélodie à partir d’un spectrogramme d’une chanson, sans générer de représentation intermédiaire. Ou, en espagnol: le système est capable de faire correspondre la mélodie fredonnée avec l’enregistrement polyphonique original de la chanson.

Spectrogramme

Pour représenter à quel point il peut être difficile d’identifier une chanson basée sur une mélodie fredonnée, Google nous montre un affichage du spectrogramme de la chanson populaire Bella Ciao dans l’image ci-dessus. Sur la gauche, vous pouvez voir la version fredonnée, tandis que sur la droite, vous pouvez voir la mélodie originale.

À partir de la visualisation de la mélodie fredonnée, le modèle développé doit recherchez les fonctionnalités permettant de l’associer à la chanson originale, en recherchant une base de données de 50 millions de chansons avec des spectrogrammes similaires.

En ce sens, Google a formé son système à se concentrer uniquement sur la mélodie prédominante, oublier les lettres, les instruments ou le timbre de la voix. Il est également capable de filtrer les autres bruits comme le son ambiant ou ce qui peut être produit par la réverbération d’une pièce.

L’entreprise explique également que cette fonction a été développée en profitant de certaines avancées dans ce domaine réalisées dans le passé, comme le système Lecture en cours que Google a introduit pour la première fois avec le Google Pixel 2, et qui permet identifier toute chanson qui joue autour de nous, sans avoir besoin d’une connexion Internet ou d’un serveur.

Lecture en cours sur le Pixel 2 XL

Lecture en cours, l’une des meilleures fonctionnalités du Pixel.

Grâce à des modifications apportées aux modèles utilisés pour donner vie à la fois à la fonction Now Playing et à la fonction Sound Search, le réseau de neurones a été formé avec paires audio, formé par une version fredonnée et une autre enregistrée à partir de la mélodie originale. Ainsi, un intégrer chacun d’eux qui seraient ensuite traités à la recherche de traits qui mettent en évidence les similitudes entre l’un et l’autre.

Ceci, réalisé des millions de fois avec des millions de chansons différentes, était l’un des grands défis quand il s’agissait de former le réseau neuronal. Pas à cause du processus d’apprentissage automatique lui-même, mais à cause de la difficulté supplémentaire d’avoir à trouver des versions fredonnées des millions de chansons utilisé au cours de ce processus.

Et c’est que pour cela, Google a été contraint de utiliser SPICE, un modèle d’extraction de ton utilisé pour générer des mélodies fredonnées qui pourrait être utilisé pour entraîner le modèle. En ce sens, Google nous montre comment sonnaient les mélodies extraites et comment les originales.

À partir de là, lorsque le système était suffisamment formé, la technique a été affinée grâce à d’autres systèmes d’apprentissage automatique avec lesquels le précision de la recherche.

En outre, la société précise que, si Les bourdonnements de l’utilisateur ne sont pas partagés automatiquement, il est possible d’activer une option qui permet à «Hum to Search» de continuer à apprendre et à améliorer ses capacités. Aujourd’hui pour aujourd’hui, la base de données contient déjà plus d’un demi-million de chansons.

Comment utiliser “Hum pour rechercher”

Tout utilisateur d’un mobile iOS ou Android peut ** utiliser «Hum pour rechercher» pour trouver des chansons simplement en les fredonnant ou en les sifflant. Pour ce faire, il vous suffit de suivre ces étapes:

Ouvrez le moteur de recherche Google, via l’application mobile ou à partir d’un navigateur Web. Appuyez sur l’icône du microphone, puis sur “Quelle est cette chanson?” Commencez à fredonner ou à siffler la chanson que vous voulez trouver, et attendez que le moteur de recherche l’identifie.

Des fonctions comme celle-ci, ou comme l’outil Google Maps qui sait comment nous dire à quel point un lieu est occupé, sont d’excellents exemples de comment l’intelligence artificielle peut nous faciliter la vie.