Google BERT, la nuova frontiera del searching engine.

Nel Googleplex si lavora senza sosta per accontentare l’infinita curiosità delle persone.

di Giovanni Pugliese

Formulare la query giusta, per cercare qualsiasi cosa utilizzando i moti di ricerca, è fondamentale per avere la certezza che ci venga restituito ciò che ci serve. Tuttavia, potremmo non conoscere le parole giuste da inserire, oppure come si scrive esattamente una determinata parola, e quindi il risultato è spesso deludente con conseguente perdita di tempo.

Secondo Pandu Nayak, Google Fellow and Vice President, E’ compito di Google, come engine searching, capire in anticipo cosa cerca l’utente e far emergere informazioni utili da web, indipendentemente da come si scrive o da come si combinano le parole nella query. Sebbene negli anni abbiamo continuato a migliorare le nostre capacità di comprensione della lingua, a volte non riusciamo ancora a farlo bene, in particolare con query complesse o conversazionali.    

Tuttavia – sempre secondo Pandu Nayak – il nostro gruppo di ricerca nella scienza della comprensione delle lingue sta facendo dei passi in avanti decisivi resi possibili dall’apprendimento automatico. Questo rappresenta una vera e propria rivoluzione nella storia dei motori di ricerca.

Quest’anno Google ha introdotto la tecnica per la comprensione della NLP (natural language processing); la Bidirectional Encoder Representation from Transformers, BERT, una tecnologia che consente “l’addestramento” del proprio sistema di risposta alle domande. Tale capacità di “addestramento” dei sistemi di engine searching è frutto della ricerca di Google sui cosiddetti Transformers, una nuova rete di architettura neurale per la comprensione del linguaggio. Queste reti neurali sono modelli di calcolo matematico-informatici basati sul funzionamento delle reti neurali biologiche, ossia modelli costituiti da interconnessioni di informazioni; tali interconnessioni derivano da neuroni artificiali e processi di calcolo, modelli che elaborano le parole in relazione a tutte le altre parole all’interno di una frase, anziché l’elaborazione di una parola per volta. I modelli matematici BERT, quindi, sono in grado di elaborare l’intero contesto in cui una parola è inserita tenendo conto delle parole che precedono e di quelle che seguono. Tutto ciò risulterà estremamente utile quando si imposta una query di ricerca.

Specie per query molto lunghe e conversazionali o ricerche in cui preposizioni come “per” e “a” o “da” contano molto per il significato, BERT sarà in grado comprendere l’intero contesto in cui sono presenti queste parole restituendo la risposta corretta.

Di seguito, alcuni esempi che hanno mostrato la capacità di comprensione di BERT:

2019 brazil traveler to usa need a visa”. La parola “to” e la sua relazione con le altre parole della query è particolarmente importante per consentire all’algoritmo di comprenderne il significato e restituire la giusta risposta. Si tratta di un brasiliano in viaggio per gli Stati Uniti e non viceversa. In precedenza – afferma Pandu Nayak – i nostri algoritmi non capivano l’importanza di questa connessione e abbiamo erroneamente restituito risultati sui cittadini statunitensi che viaggiano in Brasile. Con BERT siamo riusciti a cogliere questa sfumatura e comprendere che la parola molto comune “to” conta moltissimo e, dandole il giusto ancoraggio grazie ai modelli di calcolo transformers sulle reti neurali, siamo in grado di restituire la risposta corretta.

Vediamo un’altra query di esempio:

“do estheticians stand a lot work”. In precedenza – continua Nayak – i nostri sistemi adottavano un approccio di corrispondenza della parola chiave, associando il termine “stand-alone” nel risultato con la parole “stand” nella query. I nostri modelli BERT comprendono che “stare in piedi” è legato al concetto delle esigenze fisiche di un lavoro e mostra, come si può vedere dall’esempio, una risposta più utile.

Tuttavia, la ricerca non è un problema risolto per i searching engines; la comprensione della lingua rimane una sfida continua anche se, tuttavia, per aziende come Google sembra essere una spinta motivazionale a migliorare le proprie performance.

pubblicità

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *