Accéder au menu principal
Blog Google France
IA

Le corse, nouvelle langue régionale accessible depuis Google Traduction



Nous annonçons ce jour que le corse est désormais disponible dans Google Traduction, ce qui fait de cette langue régionale une des toutes premières en France à intégrer Google Traduction. Nous ajoutons aussi simultanément 12 nouvelles langues, parlées au total par 120 millions de personnes à travers le monde*, dont le luxembourgeois, le gaélique écossais ou encore l’hawaïen, ce qui porte à 103 le nombre de langues disponibles dans notre service de traduction instantanée. Lancé en 2006, Google Traduction s’est progressivement enrichi pour couvrir désormais 99% des langues parlées par la population en ligne.

Pour déterminer le lancement d’une nouvelle langue, nous regardons beaucoup de critères : tout d’abord, il doit s’agir d’une langue écrite. Ensuite, il est nécessaire de trouver en ligne de nombreuses traductions dans cette nouvelle langue. A partir de là, nous utilisons une combinaison de machine learning, de contenus sous licence, et le recours à la communauté de Google Traduction.

Le machine learning prend toute son importance lorsqu’il s’agit de scanner des milliards de textes déjà traduits et d’en identifier des modèles statistiques à grande échelle, afin de permettre aux machines “d'apprendre” la langue. Mais les documents existants ne reflètent pas l’exhaustivité et la richesse d’une langue : nous comptons donc sur vous, utilisateurs de notre communauté Google Traduction, pour nous aider à améliorer les langues disponibles dans Google Traduction et en lancer des nouvelles, telles que le corse. A ce jour, plus de 3 millions de personnes ont contribué à l’amélioration d’environ 200 millions de mots traduits.

La Journée Internationale de la langue maternelle arrivant à grands pas (21 février), nous vous invitons d’ailleurs à profiter de cette opportunité pour rejoindre notre communauté Google Traduction.

Enfin, mes racines étant aussi du côté de l’Ile de Beauté, j’ai été naturellement très sensible à l’ajout du corse que j’ai bien sûr soutenu activement. Les technologies du numérique représentent un formidable outil pour préserver et valoriser les cultures locales. Dans un monde globalisé, Internet favorise le sentiment d’appartenance à une communauté et nous sommes heureux d’y contribuer en ajoutant le corse à Google Traduction.

Alors n’attendez plus, aidez nous à refléter la richesse de votre langue et partagez vos connaissances pour une meilleure compréhension des internautes à travers le monde.

À Prestu !

*Les 13 nouvelles langues sont les suivantes : le corse, le luxembourgeois, l’amharique, le frison, le kirghize, l’hawaïen, le kurde (kurmanji), le samoan, le gaélique écossais, le shona, le sindhi, le pachtou et le xhosa. ce qui vous permet désormais de traduire des contenus dans 103 langues au total.