L'Intelligenza Artificiale alla base delle nostre ricerche

04 Feb, 2022

Pandu Nayak

Google Fellow and Vice President, Search

Barra di ricerca con la scritta "L'AI alla base delle nostre ricerche"

In che modo l'Intelligenza Artificiale è alla base di ottimi risultati di ricerca

Vi siete mai chiesti come fa Google a comprendere quello che state cercando? Sono molti gli aspetti che consentono di fornire risultati della Ricerca utili e la comprensione del linguaggio è una delle competenze più importanti. Grazie ai progressi nel campo dell'Intelligenza Artificiale (AI) e del Machine Learning, i nostri sistemi di Ricerca riescono a comprendere il linguaggio umano meglio rispetto al passato; vogliamo quindi aiutarvi a capire in che modo vi vengono mostrati risultati più rilevanti per voi. Per prima cosa, però, facciamo un tuffo nel passato: agli inizi della Ricerca, prima che apportassimo miglioramenti basati sull'AI, i nostri sistemi cercavano semplicemente delle parole corrispondenti. Ad esempio, se aveste cercato "pziza", a meno che non esistesse una pagina con questo specifico errore di ortografia, probabilmente avreste dovuto ripetere la ricerca con l'ortografia corretta per trovare una pizza nella vostra zona. Alla fine, abbiamo però imparato a codificare algoritmi per individuare classi di pattern, come errori ortografici comuni o potenziali errori di digitazione causati da tasti vicini. Ora, grazie al machine learning avanzato, i nostri sistemi possono riconoscere in modo più intuitivo se una parola sembra errata e suggerire una possibile correzione.
Questi tipi di miglioramenti basati sull'AI consentono ai nostri sistemi della Ricerca di comprendere sempre meglio ciò che cercate e, dato che il mondo e la curiosità delle persone sono in continua evoluzione, è molto importante che lo sia anche la Ricerca. Di fatto, il 15% delle ricerche che registriamo ogni giorno è completamente nuovo. L'AI svolge un ruolo fondamentale nel mostrarvi risultati utili, anche ai confini più estremi della vostra immaginazione.

Come i nostri sistemi interagiscono tra di loro

Nel corso degli anni abbiamo sviluppato centinaia di algoritmi, come il nostro primo sistema di controllo ortografico, per poter fornire risultati di ricerca pertinenti. Quando sviluppiamo nuovi sistemi di AI, i nostri algoritmi e sistemi precedenti non vengono messi da parte; di fatto, la Ricerca funziona basandosi su centinaia di algoritmi e modelli di machine learning e siamo in grado di migliorarla quando i nostri sistemi, nuovi e vecchi, riescono a interagire bene tra di loro. Ogni algoritmo e ogni modello ha un ruolo specifico, ma si attivano in momenti diversi e in combinazioni distinte per contribuire a offrire i risultati più utili; inoltre, alcuni dei nostri sistemi più avanzati possono avere un ruolo più rilevante di altri. Esaminiamo più da vicino i principali sistemi di AI di cui si avvale attualmente la Ricerca e che cosa fanno.

RankBrain, un sistema di ranking più intelligente

RankBrain, lanciato nel 2015, è stato il primo sistema di deep learning implementato nella Ricerca. A quel tempo è stato rivoluzionario, non solo perché era il nostro primo sistema di AI, ma perché ci ha aiutato a comprendere come le parole sono correlate ai concetti; questo è un qualcosa che gli esseri umani capiscono istintivamente, ma rappresenta una sfida complessa per un computer. RankBrain ci aiuta a recuperare informazioni che non eravamo in grado di trovare in precedenza comprendendo in modo più ampio come le parole in una ricerca sono correlate a concetti del mondo reale. Ad esempio, se cercate "come viene denominato il consumatore al livello più alto della catena alimentare", i nostri sistemi, vedendo queste parole in varie pagine, apprendono che il concetto di catena alimentare potrebbe avere a che fare con gli animali e non con i consumatori umani. Comprendendo queste parole e abbinandole ai loro concetti correlati, RankBrain ci aiuta a capire che state cercando quello che viene comunemente chiamato un "superpredatore". Grazie a questo tipo di comprensione, RankBrain viene utilizzato per migliorare il ranking dei principali risultati di ricerca o deciderne l'ordine più adeguato. Sebbene sia stato il nostro primo modello di deep learning, RankBrain continua a essere uno dei principali sistemi di AI su cui si basa oggi la Ricerca.

Corrispondenza neurale, un sofisticato motore per il recupero

Le reti neurali sono oggi alla base di molti moderni sistemi di AI. Tuttavia, è stato solo nel 2018, anno in cui abbiamo introdotto la corrispondenza neurale nella Ricerca, che abbiamo potuto utilizzarle per capire meglio in che modo le query sono correlate alle pagine. La corrispondenza neurale ci aiuta a comprendere le rappresentazioni meno definite dei concetti nelle query e nelle pagine e ad associarle l'una all'altra; viene esaminata un'intera query o pagina invece che le sole parole chiave, sviluppando una migliore comprensione dei concetti di base rappresentati. Prendete, ad esempio, la ricerca "informazioni su come gestire una persona verde". Se ve lo chiedesse un amico, probabilmente sareste disorientati; ma, grazie alla corrispondenza neurale, siamo in grado di dare a questa ricerca il giusto senso. Mediante l'analisi di rappresentazioni più ampie dei concetti nella query, quali management, leadership, personalità e altri, la corrispondenza neurale è in grado di decifrare che questo utente sta cercando consigli di management secondo una popolare guida alle personalità basata sui colori.
Quando i nostri sistemi capiscono i concetti più ampi rappresentati in una query o in una pagina, possono associarli tra di loro più facilmente. Questo livello di comprensione ci aiuta ad avere un raggio più ampio quando scansioniamo il nostro indice alla ricerca di contenuti che possono essere pertinenti per la vostra query; è questo che rende la corrispondenza neurale una parte così cruciale del modo in cui recuperiamo documenti pertinenti da un flusso di informazioni immenso e in costante cambiamento.

BERT, un modello per la comprensione del significato e del contesto

Lanciato nel 2019, BERT ha rappresentato un cambiamento enorme nella comprensione del linguaggio naturale, aiutandoci a capire come le combinazioni di parole esprimono significati e intenti diversi. Invece che cercare semplicemente contenuti che corrispondono alle singole parole, BERT ci permette di capire come una combinazione di termini esprime un'idea complessa; BERT comprende le parole in una sequenza e come sono in relazione l'una con l'altra e questo ci garantisce di non tralasciare parole importanti della vostra query, a prescindere da quanto siano piccole. Ad esempio, se cercate "si possono prendere le medicine di qualcun altro farmacia", BERT capisce che state provando a capire se potete ritirare dei medicinali per un'altra persona. Prima di BERT, davamo per scontato quella piccola preposizione mancante, mostrando principalmente risultati su come ordinare un farmaco. Grazie a BERT, comprendiamo che anche le parole più piccole possono avere un grande significato.
Oggi BERT svolge un ruolo fondamentale in quasi tutte le query in inglese, in quanto i nostri sistemi BERT eccellono in due dei compiti più importanti nel fornire risultati pertinenti: il ranking e il recupero. Basato sulla sua complessa comprensione del linguaggio, BERT è in grado di classificare molto rapidamente i documenti secondo la loro pertinenza. Grazie all'addestramento di BERT, abbiamo anche migliorato i sistemi precedenti, rendendoli più utili al momento di recuperare documenti pertinenti a scopi di ranking. Inoltre, sebbene BERT abbia un ruolo primario nella Ricerca, non opera mai in modo isolato: come tutte le nostre soluzioni, BERT fa parte di un gruppo di sistemi che lavorano insieme per condividere risultati di alta qualità.

MUM, dalla comprensione del linguaggio a quella delle informazioni

Nel mese di maggio abbiamo introdotto nella Ricerca il nostro ultimo traguardo dell'AI: Multitask Unified Model o MUM. All'incirca 1000 volte più potente di BERT, MUM è in grado sia di comprendere che di generare un linguaggio. È addestrato in 75 lingue e per molte attività differenti contemporaneamente; in questo modo, può sviluppare una comprensione più completa delle informazioni e della conoscenza del mondo. MUM è inoltre multimodale, il che significa che può capire le informazioni tramite più modalità come testo, immagini e altro ancora in futuro. Anche se stiamo solo iniziando a sfruttare il potenziale di MUM, lo abbiamo già utilizzato per migliorare le ricerche di informazioni sui vaccini anti COVID-19 e non vediamo l'ora di offrire modi più intuitivi per effettuare ricerche mediante una combinazione di testo e immagini in Google Lens nei prossimi mesi. Si tratta di applicazioni molto specializzate, quindi MUM al momento non viene utilizzato per contribuire al ranking e al miglioramento della qualità dei risultati di ricerca come invece fanno i sistemi di RankBrain, corrispondenza neurale e BERT. Man mano che introdurremo nella Ricerca un maggior numero di esperienze basate su MUM, cominceremo a passare dalla comprensione del linguaggio avanzata a una più sfumata delle informazioni sul mondo. Inoltre, come per tutti i miglioramenti alla Ricerca, ogni applicazione di MUM verrà sottoposta a una rigorosa procedura di valutazione, con un occhio di riguardo all'applicazione responsabile dell'AI. Una volta implementate, queste nuove soluzioni si uniranno a tutti gli altri sistemi che cooperano per rendere la Ricerca utile.

Etichette: