Lo stato dell’arte dell’AI: i principali takeaways dell’Artificial intelligence index report 2025 di Stanford

L’AI si evolve a velocità così elevate da rendere difficile scattare una foto che catturi lo stato dell’arte. Fondamentale in tal senso è l’Artificial intelligence index report, redatto dall’Institute for Human-Centered Artificial Intelligence dell’Università di Stanford.

L’AI evolve così in fretta che qualsiasi fotografia sullo stato dell’arte rischia di venire sfuocata. La velocità dei progressi non può però esimerci dal riflettere sulle direzioni che l’evoluzione dell’AI sta prendendo.

Per cercare di rispondere a questa domanda, è fortemente consigliato consultare l’Artificial Intelligence Index Report, uno degli studi più autorevoli al mondo sull’evoluzione dell’AI.

Redatto ogni anno dall’Institute for Human-Centered Artificial Intelligence (HAI) dell’Università di Stanford, l’Index report fornisce un’analisi approfondita dei trend più rilevanti, dei progressi tecnologici, delle applicazioni industriali e degli impatti socio-economici dell’AI.

L’edizione 2025, frutto del lavoro di oltre 50 ricercatori e autori, racconta in 8 capitoli e oltre 500 pagine come l’AI sta impattando nell’ambito della ricerca, della società, dell’economia e della governance globale.

In questo articolo vi proponiamo un riassunto chiaro e sintetico dei 12 principali takeaways del report. Per approfondimenti, vi invitiamo a consultare il report integrale.

I 12 takeaways principali dell’Artificial Intelligence Index Report 2025

1. Le prestazioni dell’AI nei benchmark più complessi continuano a migliorare

Nel 2023 sono stati introdotti nuovi benchmark come MMMU, GPQA e SWE-bench, con l’obiettivo di testare i limiti dei sistemi AI avanzati. Spieghiamo brevemente cosa sono:

  • il MMMU (Massive Multi-discipline Multimodal Understanding) è un test che valuta la capacità dell’AI di comprendere contenuti complessi e multimodali (ad esempio testo più immagini) in diverse discipline accademiche, come storia, biologia, economia. Serve a misurare il ragionamento su materiali simili a quelli che si trovano in esami universitari.
  • il GPQA (Graduate-Level Physics Question Answering) è un benchmark con domande di fisica avanzata, simili a quelle che si incontrano in un dottorato. Serve a testare quanto un modello AI riesca a ragionare su problemi scientifici di alta difficoltà.
  • Il SWE-bench (Software Engineering Benchmark) valuta la capacità dell’AI di leggere, comprendere e correggere codice software reale preso da progetti open-source. È molto utile per capire quanto l’AI sia efficace come assistente alla programmazione.

A distanza di un anno, i modelli AI hanno mostrato miglioramenti notevoli, con incrementi rispettivi del 18,8%, 48,9% e 67,3% sui tre nuovi benchmark. Enormi progressi sono stati fatti anche nella generazione di video di alta qualità, con modelli AI che, in alcune circostanze, hanno superato gli esseri umani in compiti di programmazione con budget temporali limitati.

L’Index report tuttavia sottolinea come la valutazione dell’AI sia ancora troppo centrata sulle prestazioni tecniche e propone di superare i classici benchmark, adottando metodi più completi che includano impatti sociali, ambientali, economici ed etici. Solo così si potrà capire se un sistema AI è davvero “migliore” e utile per la società.

2. L’AI è sempre più integrata nella vita quotidiana

L’AI sta diventando sempre più parte della vita di tutti i giorni. Nel 2023, la FDA (Food and drug administration, autorità regolatoria statunitense nel settore farmaceutico equivalente all’europea EMA e all’italiana AIFA), ha approvato 223 dispositivi medici basati su AI, contro appena 6 approvati nel 2015.

Anche nel settore automobilistico, le auto a guida autonoma sono ormai una realtà: i taxi a guida autonoma di Waymo forniscono oltre 150.000 corse autonome a settimana in diverse città USA tra cui San Francisco, Phoenix e Los Angeles, mentre la flotta Apollo Go di Baidu è attiva in numerose città cinesi.

Ma anche nel quotidiano, smartphone con assistenti AI integrati per migliorare la ricerca di informazioni o l’editing delle fotografie che scattiamo tutti i giorni sono una realtà per sempre più persone.

3. Le imprese puntano tutto sull’AI, alimentando investimenti e adozione da record

A livello globale, gli investimenti aziendali nell’AI hanno toccato i 252,3 miliardi di dollari nel 2024, con una crescita del 44,5% degli investimenti privati e un aumento del 12,1% nelle fusioni e acquisizioni rispetto al 2023.

Il settore dell’AI generativa è in forte ascesa: gli investimenti privati nella Gen AI hanno raggiunto i 33,9 miliardi di dollari nel 2024, con un aumento del 18,7% rispetto al 2023. Il settore rappresenta ora più del 20% di tutti gli investimenti privati legati all’intelligenza artificiale.

Gli investimenti dei privati nel settore dell’AI si concentrano in particolare negli USA, dove nel 2024 hanno raggiunto i 109,1 miliardi di dollari.

L’utilizzo aziendale, la cosiddetta AI adoption, è salito al 78% a livello globale rispetto al 55% dell’anno precedente, anche se rimangono differenze a livello regionale. In Italia, ad esempio, i dati dell’Osservatorio Artificial Intelligence del Politecnico di Milano evidenziano un gap nell’AI adoption tra grandi imprese e PMI.

Anche la quota di chi ha riferito di usare l’AI generativa in almeno una funzione aziendale è più che raddoppiata a livello globale, passando dal 33% al 71%. Tra i fattori che stanno determinando questo incremento nell’utilizzo della Gen AI in azienda vi sono anche programmi di adoption sempre più efficaci, come mostra ad esempio il caso Dojo, la community di adozione di Microsoft Copilot sviluppata dalla design company Logotel per Italgas.

Un insight importante che emerge dall’Index report 2025 è quello relativo alla produttività. Già la precedente edizione dava conto di studi che dimostravano l’impatto positivo dell’integrazione dell’AI per la produttività aziendale e per la riduzione dei gap di competenze (skill gap) tra i lavoratori. Nel 2025 questo trend viene corroborato da un numero sempre maggiore di ricerche.

4. Gli USA guidano lo sviluppo dei modelli AI di punta, ma la Cina recupera terreno

Per quanto riguarda l’AI, la leadership USA (e nello specifico dell’area di San Francisco) appare al momento incontrastabile. Gli USA hanno prodotto 40 modelli AI di rilievo nel 2024, contro i 15 della Cina.

Tuttavia, i modelli cinesi stanno raggiungendo livelli di performance quasi pari, riducendo drasticamente il divario su benchmark come MMLU e HumanEval. La Cina, inoltre, è in testa per numero di pubblicazioni scientifiche e brevetti legati all’AI.

Non solo: l’Index report riguarda il 2024 e non tiene dunque conto del fenomeno Deepseek, startup cinese che ha guadagnato notorietà internazionale nel gennaio 2025 con il lancio del suo modello linguistico DeepSeek-R1, un chatbot disponibile gratuitamente su iOS e Android.

Deepseek ha rapidamente scalato le classifiche, diventando l’app gratuita più scaricata negli Stati Uniti e superando ChatGPT. Il successo di DeepSeek ha avuto inoltre un impatto immediato sui mercati finanziari, facendo crollare i titoli di aziende come Nvidia e Alphabet. Anche se in seguito queste aziende hanno recuperato le perdite, il “caso Deepseek” è emblematico di come la Cina possa seriamente insidiare la leadership USA nell’ambito dell’AI nel prossimo futuro.  

5. L’ecosistema dell’AI responsabile evolve, ma in modo disomogeneo

Secondo l’AI Incidents Database, un archivio pubblico che raccoglie e documenta questi episodi per monitorare i rischi concreti dell’uso dell’AI nel mondo reale, il numero di incidenti segnalati legati all’AI è salito a 233 nel 2024, in un aumento del 56,4% rispetto al 2023.

Per incidenti legati all’AI si intendono malfunzionamenti, abusi o conseguenze dannose causate da sistemi di intelligenza artificiale. Anche se il loro numero è in forte aumento, le pratiche standard per valutarne sicurezza e correttezza sono ancora rare.

È vero che sono nati nuovi benchmark come HELM Safety e FACTS. Il primo valuta la sicurezza dei modelli linguistici testandone il comportamento in scenari sensibili, come l’uso improprio o la generazione di contenuti pericolosi. Il secondo misura quanto le risposte di un modello siano fattualmente corrette in dialoghi realistici, aiutando a identificare errori e allucinazioni.

Nonostante questi timidi segnali positivi, la maggior parte delle aziende riconosce i rischi senza agire concretamente. I governi, invece, mostrano un’accelerazione nella regolamentazione dell’AI responsabile, come spiegato nel punto 8.

6. L’ottimismo globale sull’AI cresce, ma con forti differenze regionali

Paesi asiatici come Cina, Indonesia e Thailandia mostrano un’alta fiducia nei benefici dell’AI. In Nord America e Europa occidentale, prevale invece una visione più scettica. Tuttavia, anche nei Paesi più critici si registra un incremento di fiducia rispetto agli anni precedenti, a testimonianza di una crescente apertura verso l’AI.

7. L’AI diventa più efficiente, economica e accessibile

Il costo per utilizzare modelli simili a GPT-3.5 è crollato di oltre 280 volte in meno di due anni. I progressi hardware e l’ascesa di modelli open-source stanno abbattendo le barriere all’accesso. I modelli a pesi aperti ora rivaleggiano con quelli chiusi anche in termini di prestazioni.

8. I governi aumentano investimenti e regolamentazione sull’AI

Nel 2024, gli USA hanno raddoppiato il numero di regolamenti federali sull’AI rispetto all’anno precedente. Sempre nel 2024 in Europa è entrato in vigore l’AI Act, un regolamento destinato a normare nei prossimi anni lo sviluppo e l’utilizzo dell’AI nella Regione, ma che non è stato esente da polemiche.

Allo stesso tempo, Paesi come Canada, Cina, Francia e Arabia Saudita hanno annunciato piani multimiliardari per infrastrutture AI. L’attenzione istituzionale è ormai globale e trasversale.

9. L’educazione in AI e informatica cresce, ma permangono disuguaglianze

Due terzi dei Paesi mondiali offrono ora programmi di informatica nei cicli formativi della scuola dell’obbligo. Tuttavia, permangono barriere in Paesi con problemi infrastrutturali. Negli Stati Uniti, la maggior parte dei docenti ritiene che l’AI debba far parte della formazione di base, ma pochi si sentono pronti a insegnarla.

10. L’industria accelera, ma la competizione di frontiera si fa serrata

Quasi il 90% dei modelli AI di rilievo nel 2024 è stato prodotto da aziende, ma la differenza tra i modelli di punta si riduce. Il gap tra il primo e il decimo modello nella classifica di performance è sceso al 5,4%, indicando una crescente densità e concorrenza ai vertici del settore.

11. L’AI riceve i massimi riconoscimenti per il suo impatto sulla scienza

Nel 2024, due Premi Nobel sono stati assegnati per contributi collegati all’AI: uno in Chimica (per AlphaFold, sistema sviluppato da Google DeepMind che ha rivoluzionato la biologia strutturale prevedendo con altissima precisione la struttura tridimensionale delle proteine a partire dalla loro sequenza di amminoacidi), e uno in Fisica (per le reti neurali). Il prestigioso Turing Award è andato a pionieri del reinforcement learning. È una conferma dell’importanza centrale che l’AI sta assumendo nella ricerca scientifica.

12. Il ragionamento complesso resta una sfida irrisolta per l’AI

L’aggiunta di meccanismi come il chain-of-thought reasoning (ragionamento a catena) ha fatto progredire le prestazioni dei modelli linguistici di grandi dimensioni (LLM) nel ragionamento. Tuttavia, l’AI continua a fallire in compiti che richiedono logica, pianificazione e generalizzazione in contesti complessi. Queste lacune limitano l’affidabilità dei modelli in settori critici come la medicina (pur con eccezioni in singoli task come il riconoscimento delle immagini diagnostiche), la finanza e la giustizia.

Per capire in cosa l’AI eccelle e in cosa no, e di conseguenza cosa è bene chiedere all’AI e su cosa invece mantenere un alto controllo umano, può essere interessante leggere la riflessione di Ethan Mollick, co-direttore dell’AI generative Lab alla Wharton University e uno degli esperti più influenti sul tema dell’AI.  

In conclusione: cresce l’ottimismo, ma la fiducia nell’AI resta una sfida importante

L’AI Index Report 2025 dipinge il quadro di un campo non solo in rapida evoluzione tecnica, ma profondamente intrecciato con la vita di tutti i giorni, l’economia e la politica globale.

I progressi su benchmark, l’innovazione hardware e la diminuzione dei costi di utilizzo indicano una tecnologia sempre più potente e accessibile. L’impatto sulla scienza e la medicina, con modelli sempre più sofisticati e capacità diagnostiche superiori in alcuni ambiti, è tangibile e promettente. Aumenta anche a livello globale l’ottimismo sul potenziale dell’AI di offrire ampi benefici alla società.

Nonostante questo incremento, le differenze regionali e la persistente sfida nel ragionamento complesso ci ricordano che il percorso dell’AI è ancora lungo e complesso.

Non solo: restano aperte le questioni legate all’impatto ambientale, alla disinformazione, all’equità di queste tecnologie e ai pregiudizi (bias) con cui viene alimentata. Come ricordano nella loro introduzione Yolanda Gil e Raymond Perrault, co-direttori del rapporto, “la fiducia rimane una sfida importante”. Chissà se l’edizione del report del prossimo anno farà segnare progressi significativi anche in questa direzione.