Arcangelo Rociola
C’è un’intelligenza artificiale che parla in italiano. Pensa in italiano. Compone frasi, elabora risposte, ragiona in italiano. È ancora poco nota, ma c’è. Sta prendendo vita nei corridoi dei dipartimenti delle università, nei centri di ricerca delle aziende, delle startup, in esempi virtuosi della pubblica amministrazione. Un movimento dal basso. Vivace. Fatto di donne e uomini con competenze d’avanguardia. Al lavoro su strumenti in grado di dotare l’Italia degli asset necessari per competere nella sfida posta dalle nuove tecnologie dell’Ai generativa. L’Intelligenza artificiale è diventata una priorità per il governo. La presidente del Consiglio, Giorgia Meloni, ha annunciato investimenti per un miliardo per sviluppare progetti italiani. Il sottosegretario alla presidenza del Consiglio, Alessio Butti, ha ribadito l’importanza per l’Italia di avere una ChatGpt italiana, per rispondere alle esigenze di sicurezza e privacy chieste dalle aziende italiane.
Un’esigenza che sta disegnando traiettorie nuove nelle evoluzioni dell’innovazione: non più subita dai grandi player internazionali, ma creata nei vari paesi per rispondere a esigenze proprie nel rispetto della propria cultura e delle proprie tradizioni. «Ci sono almeno un paio di ragioni per preferire un’Ai generativa italiana. Una è il controllo e la sovranità dei dati, fondamentale per le aziende. L’altra è la perfomance sulla lingua, visto che oggi i chatbot ragionano in inglese e poi traducono». Giovanni Germani è uno scienziato dei dati di Fastweb che sta sviluppando un Ai generativa in italiano. La questione della lingua non è secondaria: un’Ai generativa come Chatgpt è il frutto di un lungo addestramento fatto da queste macchine su testi scritti. Il 98% di questi testi è in inglese.
«Un’Ai che pensa in italiano è importante per un’azienda che vuole magari un chatbot in grado di rispondere ai clienti italiani comprendendo esattamente quello che vogliono dire, rispondendo con testi corretti e precisi», continua Germani. Fastweb inaugurerà a breve un data center in Lombardia. Lì sarà installato un supercomputer in grado di addestrare il primo LLM in italiano. Gli saranno dati in pasto testi solo in italiano: Wikipedia, fonti giornalistiche, social media, cercando accordi con i vari enti.
iGenius, nata a Milano nel 2016 da Uljan Sharka, lo scorso mese ha annunciato un progetto per creare un LLM in italiano sviluppato con Cineca, il consorzio formato da università e enti pubblici che a Bologna ha uno dei computer più potenti al mondo. Si chiama Leonardo. Per avere un’idea di quanto sia potente, basti pensare che in un’ora può fare calcoli che al più avanzato laptop in commercio richiederebbero 920 anni di lavoro. Il progetto è cofinanziato da Commissione europea e ministero dell’Università e della ricerca e sta consentendo all’Italia di scalare sull’Intelligenza artificiale a buon ritmo.
«L’importanza di questo supercomputer per l’Italia è enorme», spiega Alessandra Poggiani, direttrice generale di Cineca che poi aggiunge: «Tutte le università italiane e i gruppi di ricerca hanno accesso gratuito a Leonardo. La Commissione europea ha accertato che l’Italia è il Paese dove la comunità scientifica nazionale usa di più il supercalcolo per le sue ricerche». Leonardo è stato usato da Mistral, la startup francese di Ai generativa passata in 4 mesi da zero a 2 miliardi di valutazione. E Leonardo è usato da molti progetti di ricerca italiani sull’Ai generativa. Llamantino è uno di questi: è stato sviluppato da un gruppo di ricerca del dipartimento di Informatica dell’Università di Bari. «Volevamo creare un’alternativa italiana a ChatGpt. Anzi, qualcosa che fosse in contrapposizione a ChatGpt, perché noi crediamo nel modello aperto dell’Intelligenza artificiale, non chiuso come quello di OpenAI» dice Lucia Siciliani, la ricercatrice che con altri colleghi ha scritto il progetto di Llamantino: «Sappiamo che può essere applicabile a ambiti industriali».
Da Bari alla Toscana. Cerbero è un progetto di LLM dell’Università di Pisa. È stato creato da un gruppo di ricerca guidato da Federico Gatolo: «Abbiamo da poco rilasciato la seconda versione. È una Chatgpt, ma italiana. Se tutto va bene sarà buono come Mistral, ma con una licenza del tutto open. Cerbero ha la caratteristica di essere addestrato su un dataset di alta qualità. Quindi la scelta dei testi in italiano su cui è stato addestrato doveva rispettare parametri molto alti dal punto di vista linguistico».
A Roma l’Università La Sapienza ha diversi progetti: Fauno, Camoscio e Dante. «Un addestramento in italiano è più sensibile alle piccole variazioni della lingua. Abbiamo condotto degli studi e sappiamo che gli LLM in inglese non hanno la giusta sensibilità per capire frasi potenzialmente offensive in altre lingue. Se sbaglia la comprensione di un termine, sbaglia anche la sua comunicazione», spiega Fabrizio Silvesti, professore di Ai al dipartimento di ingegneria informatica.
Ma c’è anche un pezzo di Pa che sta lavorando al suo LLM. PagoPA in particolare, dove Alessandro Ercolani, sviluppatore, ha messo su Zefiro: «L’ho creato durante le ultime vacanze di Natale, ci piacerebbe usarlo per non affidarci a big player stranieri. Conversa con i clienti, lo fa in italiano, è addestrato in italiano. Ma quello che per noi è più importante è che sposa i principi che ci siamo dati come azienda: adottare l’open source come filosofia. Crediamo che lo sviluppo di queste tecnologie debba essere aperto e condiviso con tutti. Solo così può fare il bene di tutti». Un movimento dal basso. Con una propria visione del mondo e dell’Intelligenza artificiale. Italiana. —