Google a lancé l’année dernière son enregistreur vocal, capable de transcrire en temps réel sur des appareils tels que Google Pixels. Comme dans pratiquement toutes les applications Google, cela est possible grâce à l’apprentissage automatique, ce qui permet aux applications d’évoluer constamment.

Une bonne preuve en est que Google a maintenant intégré une nouvelle fonction appelée Smart Scrolling, une autre fonctionnalité basée sur le Machine Learning. Grâce à ça, les mots les plus importants de la transcription sont automatiquement choisis, pour qu’ils apparaissent ensuite dans la barre de défilement verticale. De cette façon, nous pouvons faire défiler ces mots-clés ou les toucher pour naviguer plus rapidement.

Google reconnaîtra les mots les plus importants de la transcription

Google vient d’annoncer Smart Scrolling, une fonctionnalité basée sur l’apprentissage automatique pour son application Recorder. Avec cette nouvelle fonctionnalité, l’application pourra choisissez les mots-clés que vous considérez comme clés dans l’enregistrement, pour les mettre en évidence lorsque nous faisons défiler la transcription.

Google garantit que, étant un modèle léger, il peut être exécuté localement, sans avoir besoin d’une connexion réseau

Le modèle d’apprentissage, selon Google, est si léger que peut être exécuté hors ligne, juste à partir de l’appareil. Le fonctionnement de cette fonctionnalité est assez intéressant, comme ils l’ont détaillé dans leur blog.

Ce modèle se compose de deux tâches principales: l’une extrait les mots-clés de chaque section de la transcription et l’autre choisit les sections du texte les plus informatives. Grâce à différents modèles d’extraction de texte, ils peuvent traiter toutes les tâches en parallèle, analyser le contexte de chaque mot dans le texte.

Mais comment Google peut-il savoir si un mot est pertinent? À l’aide d’un modèle d’apprentissage, le nombre de fois où le mot apparaît dans le texte est analysé, la spécificité du terme, c’est-à-dire si ce mot a un large champ sémantique ou s’il est très spécifique et d’autres données sur ledit mot. De cette manière, le modèle est capable de connaître la pertinence du mot dans le texte, de manière très résumée et simplifiée (tout cela est beaucoup plus complexe, puisqu’il s’agit de pure informatique). Google a testé cette fonctionnalité sur le Pixel 5 et n’a pas encore donné d’indices sur le moment où elle arrivera sur tous les appareils.

