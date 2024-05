Anche l’Italia, finalmente, ha i suoi modelli linguistici, realizzati dal progetto Minerva, addestrati da zero e basati su oltre 500 miliardi di parole, l’equivalente di 5 milioni di romanzi.

Il progetto, di grande valore per il nostro paese, visto che tutti i modelli linguistici usati per l’intelligenza artificiale sono fondati su altre lingue, è stato realizzato dal gruppo di ricerca di Natural Language Processing dell’Università La Sapienza di Roma all’interno di FAIR (Future Artificial Intelligence Research), grazie ai fondi del PNRR e la collaborazione di CINECA, che ha reso disponibile il supercomputer Leonardo.

A capo del team, Roberto Navigli, professore presso il Dipartimento di Ingegneria Informatica, Automatica e Gestionale “Antonio Ruberti”, coadiuvato da 15 giovani ricercatori, tra cui Edoardo Barba, Simone Conia, Pere-Lluis Huguet Cabot, Luca Moroni e Riccardo Orlando.

IL SOFTWARE

«Un modello linguistico è un sistema di apprendimento automatico, un software di Ai che ha come obiettivo primario quello di produrre un testo che sia il più probabile, rispetto alla parola o alla frase che è stata inserita. Questo non significa saper fare un riassunto o rispondere ad una domanda, perché non è questo il compito di un modello linguistico fondazionale», spiega Navigli, evidenziando la differenza con il più noto ChatGPT, che appartiene a «modelli linguistici adattati a ricevere ed eseguire istruzioni in base alla richiesta».

Per intenderci il modello linguistico fondazionale, come il Minerva, rappresenta la fase precedente del modello alla ChatGPT, che non può prescindere da quello. Di fatto il lavoro compiuto dal team de La Sapienza segna un passo in avanti netto per l’Ai made in Italy, settore in cui il nostro paese può vantare grandi competenze in termini di cervelli e know-how. «È il primo sforzo di questo tipo in Italia, fatto dando in pasto al modello le parole provenienti dal web, la più grande raccolta di testi al mondo, in cui si trova di tutto; per questo nelle fasi successive bisognerà eseguire una fase di allineamento che riduca l’uso di parole scorrette e pregiudizi di pensiero», evidenzia Navigli. Chiaro è che il progetto Minerva ha traguardi ambiziosi e si propone di ridefinire il panorama dell'intelligenza artificiale italiana, volendo fornire fondamenta trasparenti per sistemi di Ai applicabili in diversi campi, dalla comprensione del linguaggio naturale alla generazione di testo, dalla traduzione automatica all'assistenza clienti automatizzata.

LE COMPETENZE

«Quello che mi sta più a cuore da professore universitario è che questo sforzo ingegneristico, crei il know-how in Italia, competenze che speriamo restino qui e questa è già una ragione che da sola vale tutta l’impresa», aggiunge Navigli, convinto che «avere un modello addestrato solo su dati italiani e non su traduzioni automatiche inglese-italiano, significa avere un linguaggio molto più naturale e non solo come espressione della cultura italiana. Inoltre l’italiano, come lingua principe, permette di comprendere meglio sfumature ed espressioni più proprie della lingua italiana, come modi di o usi regionali».

Questa tipicità italiana renderà i modelli Minerva una risorsa preziosa per aziende e sviluppatori interessati a sfruttare le potenzialità dell'Ai. Aggiunge Navigli: «In questi giorni stiamo lanciando una serie di modelli basati su Minerva che svolgono un solo task per riassunti automatici ed in futuro per traduzione automatica: saranno modelli aperti ed utilizzabili gratis anche per scopi commerciali, nativi per la prima volta in lingua italiana».