110 nuove lingue in arrivo su Google Traduttore
Google Traduttore abbatte le barriere linguistiche per aiutare le persone a connettersi e a comprendere meglio il mondo che le circonda. Applichiamo sempre le tecnologie più recenti per consentire a un maggior numero di persone di accedere a questo strumento: Nel 2022 abbiamo aggiunto 24 nuove lingue utilizzando la traduzione automatica Zero-Shot, in cui un modello di apprendimento automatico impara a tradurre in un'altra lingua senza averne mai visto un esempio. Abbiamo inoltre annunciato la 1.000 Languages Initiative, un impegno a costruire modelli di IA in grado di supportare le 1.000 lingue più parlate al mondo.
Ora stiamo usando l'IA per ampliare la varietà di lingue supportate. Grazie al nostro modello linguistico di grandi dimensioni PaLM 2, stiamo introducendo 110 nuove lingue in Google Traduttore, la nostra più grande espansione di sempre.
Supporto alla traduzione per oltre mezzo miliardo di persone
Dal cantonese al Qʼeqchiʼ, queste nuove lingue rappresentano più di 614 milioni di parlanti, aprendo le traduzioni a circa l'8% della popolazione mondiale. Alcune sono lingue mondiali importanti, con oltre 100 milioni di parlanti. Altre sono parlate da piccole comunità di indigeni, mentre altre ancora non hanno quasi nessun parlante nativo, ma sono attivamente rivitalizzate. Circa un quarto delle nuove lingue proviene dall'Africa, rappresentando la nostra più grande espansione di lingue africane fino ad oggi, tra cui Fon, Kikongo, Luo, Ga, Swati, Venda e Wolof.
Anche diversi dialetti italiani inclusi come il friulano, ligure, lombardo, siciliano, veneziano.
Ecco alcune delle nuove lingue supportate da Google Traduttore:
- L'Afar è una lingua tonale parlata in Gibuti, Eritrea ed Etiopia. Tra tutte le lingue di questo lancio, l'afar è quella che ha ricevuto il maggior numero di contributi volontari da parte della comunità.
- Il cantonese è da tempo una delle lingue più richieste da Google Translate. Poiché il cantonese spesso si sovrappone al mandarino nella scrittura, è difficile trovare dati e addestrare modelli.
- Il Manx è la lingua celtica dell'Isola di Man. Si è quasi estinta con la morte dell'ultimo madrelingua nel 1974. Ma grazie a un movimento di rinascita in tutta l'isola, oggi ci sono migliaia di parlanti.
- L'NKo è una forma standardizzata delle lingue manding dell'Africa occidentale che unifica molti dialetti in una lingua comune. Il suo alfabeto unico è stato inventato nel 1949 e ha una comunità di ricerca attiva che sviluppa risorse e tecnologie per questa lingua.
- Il Punjabi (Shahmukhi) è la varietà di Punjabi scritta in caratteri persi-arabi (Shahmukhi) ed è la lingua più parlata in Pakistan.
- Il Tamazight (Amazigh) è una lingua berbera parlata in tutto il Nord Africa. Sebbene esistano molti dialetti, la forma scritta è generalmente comprensibile a tutti. È scritto in caratteri latini e in caratteri Tifinagh, entrambi supportati da Google Traduttore.
- Il Tok Pisin è un creolo basato sull'inglese e la lingua franca della Papua Nuova Guinea. Se parlate inglese, provate a tradurre in Tok Pisin: potreste riuscire a capirne il significato!
Come scegliamo le varietà linguistiche
Quando si aggiungono nuove lingue al Traduttore bisogna tenere conto di molte cose: dalle varietà che offriamo alle ortografie specifiche che utilizziamo.
Le lingue hanno un'immensa quantità di variazioni: varietà regionali, dialetti, standard ortografici diversi. In effetti, molte lingue non hanno una forma standard, quindi è impossibile scegliere una varietà "giusta". Il nostro approccio è stato quello di dare priorità alle varietà più utilizzate di ogni lingua. Ad esempio, il romaní è una lingua che ha molti dialetti in tutta Europa. I nostri modelli producono un testo che si avvicina maggiormente al romaní Vlax meridionale, una varietà comunemente usata online. Ma anche elementi di altre, come il Vlax settentrionale e il romaní balcanico.
PaLM 2 è stato un pezzo chiave del puzzle, aiutando Translate ad apprendere in modo più efficiente lingue strettamente correlate tra loro, tra cui lingue vicine all'hindi, come l'Awadhi e il Marwadi, e creoli francesi come il creolo seychellois e il creolo mauriziano. Con il progredire della tecnologia e la continua collaborazione con linguisti esperti e madrelingua, nel tempo supporteremo un numero ancora maggiore di varietà linguistiche e di convenzioni ortografiche.
Visitate il Centro assistenza per saperne di più su queste nuove lingue supportate. E iniziate a tradurre su translate.google.com o sull'app Google Traduttore su Android e iOS.