Quando a gennaio 2025 DeepSeek rilasciò il suo modello R1, il mondo tecnologico occidentale reagì con una miscela di sorpresa e scetticismo. Un anno e mezzo dopo, quel rilascio appare come il primo segnale di una trasformazione strutturale che va ben oltre la singola azienda o il singolo benchmark.La competizione tra Stati Uniti e Cina nell’intelligenza artificiale si è spostata dal piano della pura potenza computazionale a quello della distribuzione, del costo e dell’adozione industriale, un terreno su cui Pechino sta accumulando vantaggi che Washington fatica a contrastare.Ad aprile 2026, secondo lo Stanford AI Index, le aziende cinesi hanno effettivamente colmato il divario prestazionale con i rivali americani sui benchmark standard. Il primato assoluto resta ai modelli closed-source occidentali, ma la distanza si misura ormai in mesi, non in anni. Soprattutto, la partita non si gioca più solo sulla qualità massima, si gioca su chi riesce a portare l’AI nel tessuto produttivo, a quale prezzo e con quale grado di controllo sulla filiera.Indice degli argomenti
L’ecosistema dell’AI cinese: non un campione, ma un esercitoDeepSeek V4 e autosufficienza hardware: il punto di non ritornoLa questione della distillazione: accuse fondate, contesto necessarioControlli all’esportazione: una strategia che perde efficaciaL’asimmetria dei modelli di business: la vera vulnerabilità americanaL’AI cinese come strumento di proiezione geopoliticaLe implicazioni dell’AI cinese per l’Europa e per l’ItaliaConclusione: tre linee di fagliaL’ecosistema dell’AI cinese: non un campione, ma un esercitoIl primo errore analitico da evitare è ridurre la competizione cinese a DeepSeek. L’ecosistema è oggi profondo e diversificato. Secondo i ranking BenchLM di aprile 2026, DeepSeek V4 Pro guida la classifica cinese con un punteggio composito di 87, seguita da Kimi K2.6 di Moonshot AI a 84 e da due varianti GLM-5 di Zhipu AI a 83 https://benchlm.ai/blog/posts/best-chinese-llm. Alibaba mantiene la gamma più ampia con la famiglia Qwen, che vanta oltre 700 milioni di download su Hugging Face a gennaio 2026, confermandosi il sistema open-weight più utilizzato al mondo https://english.news.cn/20260113/af90462629d146c2acad0e99525faba3/c.html. Baidu ha abbandonato la strategia closed per rilasciare apertamente parte dei propri modelli ERNIE.Il dato più significativo non riguarda però i benchmark, bensì i volumi di utilizzo reale. Nella settimana dal 16 al 22 febbraio 2026, quattro dei cinque modelli con il maggiore volume di chiamate API sulla piattaforma OpenRouter erano cinesi: MiniMax M2.5, Kimi K2.5, GLM-5 e DeepSeek V3.2, che insieme hanno rappresentato l’85,7% del traffico dei primi cinque. Nella stessa settimana, i modelli cinesi hanno per la prima volta superato quelli americani nel volume settimanale complessivo: 5,16 trilioni di token contro 2,7 trilioni, su una piattaforma la cui base utenti è composta per il 47% da sviluppatori statunitensi.Il dato va contestualizzato, OpenRouter è un aggregatore di API e non rappresenta l’intero mercato. Ma altre fonti convergono. Secondo Nikkei, la quota di mercato globale dei modelli cinesi è arrivata a circa il 15% nel novembre 2025, dal circa 1% di un anno prima. Secondo uno studio RAND del gennaio 2026, dopo il rilascio di DeepSeek R1 la quota cinese è passata dal 3 al 13% in appena due mesi e i modelli cinesi hanno superato il 10% degli utenti in 30 paesi e il 20% in 11.Il differenziale di prezzo è il motore principale di questa espansione. I modelli cinesi offrono accesso API a un costo da 5 a 30 volte inferiore rispetto agli equivalenti americani. DeepSeek V4-Pro costa 3,48 dollari per milione di token in output; OpenAI addebita 30 dollari per GPT-5.4, Anthropic 25 per Claude Opus 4.6. Quando un modello che costa un decimo dell’alternativa offre il 90-95% della qualità, il mercato razionale sceglie l’opzione economica e i dati di adozione lo confermano già.DeepSeek V4 e autosufficienza hardware: il punto di non ritornoIl 24 aprile 2026 DeepSeek ha rilasciato V4, un modello con 1,6 trilioni di parametri e una finestra di contesto da un milione di token, in due varianti: V4-Pro (il modello di punta) e V4-Flash (284 miliardi di parametri, orientato all’efficienza). Il rilascio è sotto licenza MIT e dunque liberamente utilizzabile e modificabile a fini commerciali.Ma la vera notizia non è il modello in sé, è l’hardware su cui è stato addestrato. V4 è il primo modello di classe frontier sviluppato interamente su chip Huawei Ascend 950PR, senza ricorrere a GPU Nvidia. A differenza di R1, che era stato addestrato su hardware Nvidia H800, V4 segna il passaggio a una filiera completamente domestica. Huawei ha confermato la compatibilità dal giorno zero dell’intera linea Ascend SuperNode e ha dichiarato che l’infrastruttura è stata completamente adattata a V4 per l’inferenza.Secondo EE Times China, il rilascio di V4 è stato deliberatamente ritardato di mesi per consentire a DeepSeek di riscrivere porzioni significative dell’architettura del modello in collaborazione con Huawei e Cambricon https://www.trendforce.com/news/2026/04/07/news-decoding-deepseek-v4-how-huaweis-ascend-950-pr-is-powering-chinas-push-to-break-cuda-dependence. L’obiettivo dichiarato è l’indipendenza da CUDA, l’ecosistema software proprietario di Nvidia, se DeepSeek riuscirà a stabilizzare l’intero stack, compilatori, operatori, framework di addestramento distribuito e inferenza, la sua pipeline di sviluppo potrebbe diventare completamente autonoma dall’hardware americano entro uno o due anni.L’impatto sull’industria cinese dei semiconduttori è immediato. ByteDance, Tencent e Alibaba hanno riaperto trattative con Huawei per nuovi ordini di chip Ascend 950 nei giorni successivi al lancio di V4. Huawei prevede di spedire circa 750.000 unità del 950PR nel 2026, con produzione di massa avviata ad aprile e volumi pieni attesi nel secondo semestre. Il chip 950PR si colloca in una fascia prestazionale compresa tra l’H100 e l’H200 di Nvidia e supera l’H20, il processore più avanzato che Nvidia poteva legalmente vendere in Cina prima del blocco delle importazioni da parte di Pechino.Il ricavo di Cambricon, altro produttore cinese di chip AI, è salito nel primo trimestre 2026 a 423 milioni di dollari, con un incremento del 160% su base annua, trainato da clienti come ByteDance e Alibaba (NAI 500, maggio 2026). Huawei stessa potrebbe avvicinarsi ai 12 miliardi di dollari di ricavi da chip AI nell’anno.La questione della distillazione: accuse fondate, contesto necessarioIl 23 febbraio 2026, Anthropic ha accusato tre laboratori cinesi, DeepSeek, Moonshot AI e MiniMax, di aver condotto campagne su scala industriale per estrarre le capacità di Claude. Secondo il comunicato di Anthropic, i tre laboratori hanno generato oltre 16 milioni di interazioni con Claude attraverso circa 24.000 account fraudolenti, in violazione dei termini di servizio e delle restrizioni di accesso regionali.L’accusa si inserisce in un crescendo. Già a gennaio 2025 OpenAI aveva segnalato attività indicative di tentativi sistematici di distillazione da parte di DeepSeek e nel febbraio 2026 ha inviato una lettera aperta al Congresso denunciando metodi per aggirare le contromisure. Parallelamente, il Dipartimento di Stato americano ha trasmesso un cablogramma diplomatico alle ambasciate con l’istruzione di avvertire i governi stranieri sulle pratiche di furto di proprietà intellettuale attribuite ai laboratori cinesi.Il contesto è però più sfumato di quanto la retorica di sicurezza nazionale suggerisca. Come notano gli analisti interpellati da CNBC, il confine tra pratiche illecite e metodi di addestramento legittimi è spesso indistinto, la distillazione è una tecnica ampiamente utilizzata nell’industria e non è di per sé illegale. Inoltre, si osserva che Anthropic stessa è stata citata in giudizio per aver scaricato in blocco libri da biblioteche ombra per addestrare i propri modelli, una pratica che solleva analoghe questioni di appropriazione. Anthropic, tra l’altro, ha recentemente chiuso una causa per violazione del copyright da parte di migliaia di autori con un risarcimento di 1,5 miliardi di dollari.La distillazione cinese è dunque un fatto reale e documentato, ma va letta all’interno di un ecosistema in cui i confini della proprietà intellettuale nell’addestramento dei modelli sono ancora largamente indefiniti, per tutti gli attori, non solo per quelli cinesi.Controlli all’esportazione: una strategia che perde efficaciaLa risposta regolatoria americana si è articolata su più livelli nel corso del 2026, ma la sua efficacia è messa in discussione da più parti. Il 15 gennaio 2026, il Bureau of Industry and Security (BIS) del Dipartimento del Commercio ha rivisto la politica di licenza per i chip avanzati destinati alla Cina, passando da una presunzione di diniego a una valutazione caso per caso per processori di livello H200 e MI325X, subordinata a certificazioni di sicurezza, test di terze parti e identificazione degli utenti finali.Contestualmente, Trump ha imposto un dazio del 25% sugli stessi chip destinati all’esportazione, presentandolo come una misura complementare alla nuova politica di licenza. A marzo 2026, il Congresso ha approvato il Chip Security Act, che prevede l’inserimento di tecnologia di tracciamento direttamente nei chip per verificarne la posizione fisica dopo l’esportazione e impedire la deviazione verso destinatari non autorizzati.Ma la domanda strategica non è se queste misure siano ben progettate, è se siano sufficienti. La risposta, a maggio 2026, è che non lo sono. DeepSeek V4 dimostra che un modello frontier può essere addestrato senza chip americani, anche con compromessi e ritardi. Come argomenta Chatham House in un’analisi di aprile 2026, l’ipotesi che i chip costituiscano un collo di bottiglia permanente è già stata smentita dall’adattamento algoritmico, dalle falle nell’enforcement e da un mercato grigio che cresce più velocemente dell’apparato regolatorio. Il contrabbando di chip è un fenomeno documentato, due casi federali di marzo 2026 hanno rivelato reti organizzate di trasferimento illegale di GPU Nvidia verso la Cina e università cinesi coinvolte in ricerca militare hanno acquistato server Super Micro con chip Nvidia soggetti a sanzioni.L’asimmetria dei modelli di business: la vera vulnerabilità americanaIl cuore della questione non è tecnologico ma economico. Il 6 maggio 2026, il presidente di OpenAI Greg Brockman ha testimoniato sotto giuramento, nell’ambito del processo Musk contro Altman, che l’azienda prevede di spendere 50 miliardi di dollari in potenza di calcolo nel solo 2026. La cifra è impressionante, supera il PIL annuo di molti paesi e rivaleggia con le spese in conto capitale annuali di Google, Microsoft e Meta individualmente.Ma i ricavi non tengono il passo. OpenAI ha generato circa 13,1 miliardi di dollari di ricavi nel 2025, in crescita rispetto ai 3,7 miliardi del 2024, ma le proiezioni aggiornate indicano un cash burn cumulativo di 665 miliardi di dollari fino al 2030, con flussi di cassa positivi attesi non prima di quell’anno. Le spese di addestramento da sole sono proiettate a quasi 440 miliardi entro il 2030. La struttura finanziaria regge solo grazie al progetto Stargate, la joint venture infrastrutturale da 500 miliardi con SoftBank, Oracle e altri e a investimenti che in larga misura sono sconti vincolati all’acquisto di capacità computazionale dagli stessi investitori: degli 80 miliardi annunciati da Amazon, Nvidia e SoftBank a febbraio, almeno 80 erano condizionati a contratti di leasing di chip e servizi cloud.DeepSeek opera in un universo economico radicalmente diverso. I costi dichiarati per il singolo run finale di pre-training di V3 ammontavano a circa 5,6 milioni di dollari, cifra che copre solo il compute dell’addestramento finale, escludendo R&S e infrastruttura, stimati da SemiAnalysis in oltre 1,5 miliardi complessivi. Per V4, DeepSeek non ha pubblicato dati analoghi, ma l’architettura Mixture-of-Experts con soli 49 miliardi di parametri attivi su 1,6 trilioni totali, combinata con l’ottimizzazione specifica per chip Huawei Ascend, suggerisce costi di inferenza drasticamente inferiori ai concorrenti occidentali. Il prezzo API di V4-Flash a 0,14 dollari per milione di token in input, da 35 a 100 volte meno di GPT-5.5 o Claude Opus 4.7, è la misura più concreta di questa asimmetria strutturale. Questa asimmetria è la vera minaccia strutturale per i laboratori americani, più della distillazione e più del sorpasso nei benchmark. Anche se i modelli cinesi sono ancora indietro rispetto ai rivali americani in termini di intelligenza grezza, stanno rapidamente guadagnando quota di mercato globale grazie alla maggiore efficienza in termini di costi. Se modelli cinesi più economici offrono abbastanza qualità per la maggior parte degli usi, diventa progressivamente più difficile giustificare i prezzi premium sui quali si fonda il modello di ricavi americano.L’AI cinese come strumento di proiezione geopoliticaI modelli open-weight cinesi non sono solo un prodotto, sono un’infrastruttura di influenza. Per molte economie emergenti in Asia, Africa e Medio Oriente, l’approccio occidentale di affittare accesso a sistemi proprietari costosi attraverso API cloud crea barriere finanziarie e istituzionali difficili da superare. La Cina offre un’alternativa, l’AI come infrastruttura condivisa, integrata in pacchetti che includono reti energetiche, connettività 5G, data center e programmi di formazione attraverso la Digital Silk Road. Alibaba Cloud e Tencent forniscono piattaforme di commercio e pagamento basate su AI in Africa e America Latina; Hikvision e Dahua esportano soluzioni di smart city in Sud-Est asiatico e America Latina.Senza cambiamenti significativi negli investimenti occidentali in modelli aperti, ci si avvicina a uno status quo in cui i modelli open cinesi continuerebbero ad aumentare il loro vantaggio in prestazioni e adozione rispetto alle controparti americane, con startup della Silicon Valley che costruiscono su modelli cinesi più forti per competere con aziende Fortune 500 che non li adottano per cautela geopolitica. Il partner di Andreessen Horowitz Martin Casado ha confermato che la maggior parte delle startup americane sta già partendo da modelli cinesi.Kyle Miller del Georgetown Center for Security and Emerging Technology inquadra la dinamica in termini strategici: la Cina sta scambiando una quota di controllo proprietario con velocità e ampiezza di diffusione, compensando la difficoltà di competere frontalmente con i campioni americani a modello chiuso. Una logica che trasforma l’associazione tra modelli aperti e soft power in qualcosa di più concreto, puro potere infrastrutturale.Le implicazioni dell’AI cinese per l’Europa e per l’ItaliaPer l’Europa, e per l’Italia in particolare, la biforcazione tra il modello americano ad altissima intensità di capitale e il modello cinese a diffusione aperta crea una trappola strategica. L’Unione Europea non ha né i campioni nazionali capaci di competere sulla frontiera con OpenAI e Anthropic, né la scala produttiva di chip per costruire un’autosufficienza hardware alla cinese. L’AI Act regola l’uso, non la produzione; le iniziative come l’EU AI Gigafactory mirano a colmare il divario infrastrutturale, ma partono da una posizione di grande svantaggio.Il rischio concreto è duplice. Da un lato, la dipendenza da API americane a prezzo crescente per i modelli più avanzati. Dall’altro, la penetrazione silenziosa dei modelli cinesi nel tessuto produttivo europeo attraverso la logica open-weight: se sono più economici, più accessibili e abbastanza buoni, le imprese europee li adotteranno per pragmatismo, indipendentemente dalle considerazioni geopolitiche dei governi. Il dato di OpenRouter, sviluppatori americani che scelgono modelli cinesi per razionalità economica, indica che questo scenario non è ipotetico, sta già accadendo.Per l’Italia, la questione interseca il tema della Transizione 5.0 e dell’adozione AI nelle PMI. Se l’AI che le imprese italiane finiranno per adottare è prevalentemente cinese e open-weight, il vantaggio competitivo si sposta a favore di chi controlla l’ecosistema di fine-tuning e supporto, e quello, oggi, è un ecosistema sempre più centrato su Pechino. La sovranità digitale europea non può essere costruita solo con regolamenti, richiede investimenti industriali nella formazione, nell’infrastruttura di calcolo e nella costruzione di capacità di sviluppo locale. Senza queste, il rischio è quello di una dipendenza tecnologica che si sposta semplicemente da Washington a Pechino o, più probabilmente, si divide tra i due.Conclusione: tre linee di fagliaLa competizione AI tra Stati Uniti e Cina si sta strutturando lungo tre linee di faglia che la rendono diversa da qualsiasi corsa tecnologica precedente.La prima è l’incompatibilità dei modelli di business. Il modello americano è ad altissima intensità di capitale, dipendente da rendimenti futuri straordinari che giustifichino centinaia di miliardi di investimento. Il modello cinese è a bassa intensità di capitale, orientato alla diffusione e alla cattura di volume. Entrambi hanno vulnerabilità, il primo rischia l’insostenibilità finanziaria, il secondo dipende dalla capacità produttiva hardware che resta vincolata, ma il secondo è strutturalmente più resiliente in uno scenario in cui l’AI diventa una commodity.La seconda è il superamento del collo di bottiglia hardware. DeepSeek V4 su Ascend 950 rappresenta la prova che un modello frontier può essere addestrato senza chip americani. Questo cambia il calcolo costi-benefici dei controlli all’esportazione: se non impediscono più lo sviluppo, rischiano di accelerare la costruzione di un ecosistema hardware alternativo che nel medio termine potrebbe competere con quello dominato da Nvidia.La terza è lo spostamento del terreno di competizione dai laboratori ai mercati emergenti e alle comunità di sviluppatori globali. Il prezzo e l’accessibilità contano più del punteggio massimo sui benchmark. Su questo terreno, la posizione cinese è oggi strutturalmente più forte di quella americana. La Cina non sta necessariamente vincendo la corsa ai modelli più avanzati. Sta vincendo qualcosa di più importante, la corsa alla distribuzione. Nella storia della tecnologia, chi vince nella distribuzione finisce quasi sempre per definire lo standard.







