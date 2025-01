Un modello di intelligenza artificiale cinese, sviluppato in gran parte da neolaureati, minaccia le grandi aziende tecnologiche americane. Il 20 gennaio DeepSeek, un’azienda di Hangzhou, ha rilasciato un modello open source chiamato DeepSeek-R1. Dopo pochi giorni è già l’app gratuita più scaricata sull’App Store di Apple, davanti a ChatGPT.

Secondo gli sviluppatori, DeepSeek-R1 batte il modello di OpenAI sotto molti aspetti di calcolo e di ragionamento. Ci è riuscito con un budget molto inferiore a quello dei colossi tecnologici statunitensi – 5,6 milioni di dollari – e con chip non all’avanguardia, a causa delle restrizioni americane sull’esportazione di tecnologie in Cina. Marc Andreessen, il fondatore miliardario della società di venture capital Andreessen Horowitz, ha scritto su Twitter che DeepSeek è “uno dei più straordinari e impressionanti passi avanti che abbia mai visto – e, in quanto open source, un enorme regalo al mondo”. A suo giudizio il lancio del modello è “il momento Sputnik dell’intelligenza artificiale”, con riferimento al primo satellite mandato in orbita intorno alla Terra nel 1957.

Che cos’è DeepSeek e chi l’ha fondata

DeepSeek è nata all’interno di High-Flyer, un hedge fund quantitativo cinese fondato nel 2016 che è tuttora il suo unico finanziatore. High-Flyer usa l’intelligenza artificiale per scegliere gli investimenti ed è diventato in breve uno dei principali hedge fund cinesi. All’inizio, come ha raccontato Wired, DeepSeek si chiamava Fire-Flyer ed era il ramo della società dedicato al deep learning.

Nel 2023 uno dei fondatori di High-Flyer, l’informatico Liang Wenfeng, ha istituito DeepSeek per sviluppare nuovi modelli di IA. In un’intervista alla testata cinese 36Kr Liang ha detto che a guidarlo non è stato l’interesse economico, ma la curiosità scientifica. “Se mi chiedeste una ragione commerciale, non riuscirei a trovarla”, ha dichiarato. “Dal punto di vista commerciale non ne vale la pena”. Un partner di Liang, citato dal Financial Times, ha detto che “quando lo abbiamo incontrato, era un tizio molto nerd con una pettinatura terribile, che parlava di costruire un cluster di diecimila chip per addestrare i suoi modelli. Non lo prendemmo sul serio. Non riusciva a spiegare la sua visione, se non dicendo: voglio costruire questa cosa che cambierà le regole del gioco. Pensavamo che potessero farlo solo giganti come ByteDance e Alibaba”.

Liang ha spiegato anche di avere reclutato soprattutto dottorandi di alcune delle più importanti università cinesi anziché ingegneri esperti, magari di ritorno dall’America. “Le nostre posizioni chiave”, ha detto nel 2023, “sono occupate perlopiù da persone che si sono laureate negli ultimi due anni”. Anche perché “la maggior parte delle persone giovani può dedicarsi completamente a una missione priva di scopi utilitaristici”. Il Ft ha scritto che grazie ai proventi dell’hedge fund Liang può permettersi di offrire stipendi che, nell’industria tecnologica cinese, sono paragonabili solo a quelli di ByteDance, la società madre di TikTok.

La guerra commerciale tra Stati Uniti e Cina

In un certo senso DeepSeek è un effetto collaterale della guerra commerciale tra Stati Uniti e Cina. Negli ultimi anni il governo americano ha imposto forti limitazioni all’esportazione di semiconduttori e di altre tecnologie verso la Cina. DeepSeek aveva accumulato negli anni alcune migliaia di chip Nvidia: una riserva insufficiente, scrive ancora Wired, per competere con giganti come Meta e OpenAI, che continuano ad aumentare il numero di chip usati nell’addestramento. Di conseguenza, come ha spiegato ancora a Wired Wendy Chang, ingegnere del software che lavora per il think tank tedesco Mercator Institute for China Studies, ha cercato di “ottimizzare l’architettura del modello” con “un insieme di trucchi da ingegneri”.

Per esempio, DeepSeek è riuscita a ridurre il consumo di memoria e a far attivare, a seconda dell’input ricevuto, solo una parte dei suoi 671 miliardi di parametri, cioè quelli più rilevanti per la richiesta. “Molti di questi approcci non sono nuovi”, ha aggiunto Chang, “ma averli combinati per produrre un modello all’avanguardia è un risultato notevole”.

Secondo l’istituto di ricerca Epoch AI, l’addestramento dell’ultimo modello di DeepSeek ha richiesto un decimo della capacità di calcolo impiegata da Meta per allenare Llama 3.1, un modello comparabile.

Filosofie a confronto

DeepSeek ha usato per l’addestramento solo la tecnica dell’apprendimento per rinforzo. Il suo modello, in sostanza, impara in base alle ricompense e alle punizioni che riceve per risultati giusti e sbagliati, come gli esseri umani imparano dall’esperienza. A differenza di altre aziende, non ha usato nemmeno a livello preliminare il cosiddetto apprendimento supervisionato, che prevede di fornire alla macchina un insieme di dati di ingresso e di uscita abbinati ed etichettati. Nelle intenzioni degli sviluppatori, questo metodo dovrebbe portare R1 a sviluppare capacità di ragionamento superiori e adattarsi meglio a situazioni nuove.

Un’altra grande differenza rispetto a molti modelli americani è che DeepSeek ha scelto un approccio open source. Il suo codice, cioè, è disponibile a tutti. Chiunque può studiarlo e migliorarlo. Una filosofia opposta a quella di Google e OpenAI, che hanno sviluppato modelli proprietari, e simile a quella di Meta, che però impone alcune restrizioni all’uso del suo Llama.

Yann LeCun, capo dell’IA di Meta ed esperto di apprendimento automatico, ha scritto su Threads: “A coloro che vedono i risultati di DeepSeek e pensano: ‘La Cina sta superando gli Usa nell’IA’. Date la lettura sbagliata. Quella corretta è: ‘I modelli open source stanno superando quelli proprietari’. DeepSeek […] ha avuto nuove idee e le ha costruite sulla base del lavoro di altri”.

Un’IA patriottica

Le restrizioni statunitensi alle esportazioni non hanno solo spinto gli ingegneri di DeepSeek a cercare altre strade, ma, secondo Liang, li hanno anche motivati. “Questa generazione incarna un senso di patriottismo, specialmente perché deve fare i conti con le limitazioni statunitensi su tecnologie critiche hardware e software”, ha detto sempre a 36Kr. “La determinazione [dei giovani] nel superare queste barriere riflette non solo la loro ambizione personale, ma anche un più ampio impegno a migliorare la posizione della Cina come leader dell’innovazione globale”.

Il “patriottismo” degli sviluppatori di DeepSeek pone però alcuni problemi. Tutte le aziende tecnologiche cinesi devono assicurarsi che i loro modelli rispecchino “i valori fondamentali del socialismo”. DeepSeek, per esempio, rifiuta di rispondere a domande sui fatti di piazza Tienanmen o sull’autonomia di Taiwan. Lo stesso è accaduto in passato per altri strumenti cinesi di IA, come il generatore di immagini Kling o Ernie-Vilg, un modello che trasforma testi in immagini lanciato nel 2022 da Baidu.

Va detto che il fenomeno non riguarda solo le IA cinesi: diverse ricerche hanno suggerito che anche i chatbot occidentali hanno preferenze politiche. Pochi giorni fa OpenAI ha rimosso l’espressione “politicamente neutrale” dal suo piano economico per l’industria dell’intelligenza artificiale statunitense.

Tanti, inoltre, sono preoccupati dall’uso che DeepSeek potrebbe fare dei dati personali degli utenti.

L’effetto sulla Borsa

Molti analisti sottolineano che l’ottimismo sull’intelligenza artificiale e la convinzione del predominio statunitense nel settore sono stati tra le principali ragioni dei grandi risultati ottenuti da Wall Street negli ultimi anni. Il modello americano prevede investimenti enormi, alla portata di poche aziende. Meta ha appena fatto sapere che nel 2025 spenderà 60 miliardi di dollari nell’intelligenza artificiale. La scorsa settimana Donald Trump ha presentato Stargate, un progetto da 500 miliardi in quattro anni per data center e infrastrutture dati avanzate che coinvolge OpenAI, Oracle, la holding giapponese SoftBank e il fondo emiratino Mgx.

DeepSeek potrebbe dimostrare che esiste anche un’altra strada, improntata all’efficienza e all’ottimizzazione, e ha fatto precipitare i titoli di molte aziende tecnologiche, statunitensi e non. Su tutte Nvidia, che è diventata la società di maggiore valore al mondo grazie al boom dell’intelligenza artificiale, e che nelle contrattazioni pre-market ha perso più del 10%. Advantest, uno dei suoi principali fornitori, ha ceduto l’8,6% a Tokyo. Microsoft, principale finanziatore di OpenAI, Alphabet (Google), Meta e Amazon hanno perso più del 3%.

© RIPRODUZIONE RISERVATA

Per altri contenuti iscriviti alla newsletter di Forbes.it CLICCANDO QUI .

Forbes.it è anche su WhatsApp: puoi iscriverti al canale CLICCANDO QUI .