Google fait progresser la synthèse vocale

583

Google possède une filiale spécialisée dans l’intelligence artificielle, DeepMind, dont les travaux ont permis d’améliorer la reproduction de la voix humaine. DeepMind s’est récemment rendu célèbre pour avoir développé une intelligence qui a battu le champion du monde du jeu de Go.

L’outil développé par DeepMind s’appelle « WaveNet ». Il est capable d’imiter la parole de façon nettement plus crédible que les systèmes déjà existants. Son efficacité a été estimée supérieure de 50 % aux technologies par modélisation et concaténation connues. Il est donc plus performant que les solutions qui servent aux assistants virtuels tels que Cortana ou Siri. Sa spécificité est d’être capable d’extraire les ondes sonores produites par la voix, puis de les imiter. Actuellement, « WaveNet » nécessite une puissance de calcul trop importante pour être incorporé à un terminal individuel, de type smartphone. DeepMind va donc s’efforcer de le miniaturiser.