DeepSeek via dagli Store, ma le BigTech la usano: ecco perchè

da Livio Varriale
0 commenti 11 minuti leggi
Deepseek AI

L’intelligenza artificiale (AI) rappresenta uno dei salti evolutivi più significativi della nostra epoca, rivoluzionando settori che vanno dalla medicina alla finanza, dall’automazione industriale al
trattamento del linguaggio naturale. All’interno di questo contesto, DeepSeekAI emerge come un sistema avanzato progettato per ottimizzare la ricerca e l’analisi di dati complessi attraverso tecniche di
machine learning e deep learning. Basandosi su architetture neurali avanzate, DeepSeekAI non solo ridefinisce i criteri tradizionali della ricerca digitale, ma introduce nuovi modelli di elaborazione del
linguaggio naturale (NLP) che permettono un’intelligenza computazionale più umana e contestuale. Questo articolo esplora l’architettura, gli algoritmi e le applicazioni di DeepSeekAI, evidenziando come
questo sistema possa rappresentare una soluzione innovativa per problemi complessi in diverse aree professionali.

Architettura di DeepSeekAI

L’architettura di DeepSeekAI è progettata per gestire processi di ricerca e analisi a livello avanzato. Il sistema utilizza reti neurali profondi (deep neural networks) che integrano componenti specifici
per il trattamento del linguaggio naturale, come i modelli basati su transformer. Questa struttura permette a DeepSeekAI di elaborare contemporaneamente grandi quantità di dati, identificando pattern e relazioni nascoste all’interno delle informazioni.

La componente principale dell’architettura è il modulo di pre-elaborazione dei dati, che include tecniche avanzate per la pulizia e la strutturazione degli input. Questo passaggio è cruciale per
eliminare rumori e normalizzare i dati in modo da ottimizzare l’apprendimento automatico. Successivamente, i dati vengono processati attraverso layer neurali progettati per estrarre caratteristiche
significative, utilizzando tecniche come la convoluzione spaziale e temporale.

Un aspetto peculiare di DeepSeekAI è il suo approccio modulare, che consente di adattare l’architettura a specifici task senza dover ricomporre l’intero sistema. Questa flessibilità rende DeepSeekAI un
strumento versatile capace di gestire problemi che vanno dall’analisi di testi in lingua naturale alla previsione di trend complessi.

Algoritmi e tecniche

Gli algoritmi utilizzati da DeepSeekAI rappresentano una sintesi di tecniche tradizionali e innovative. Il cuore del sistema è costituito da modelli di deep learning che impiegano reti neurali profondi
per imparare strutture latenti nei dati. Questi modelli sono addestrati su grandi insiemi di dati, permettendo a DeepSeekAI di migliorare gradualmente le sue prestazioni attraverso l’esperienza.

Un componente fondamentale è la integrazione di tecniche NLP avanzate, che consentono al sistema di comprendere e generare testo in modo umanoide. Questo include l’utilizzo di modelli basati su
transformer, come BERT o GPT, che hanno dimostrato una superiorità nel trattamento del linguaggio naturale rispetto agli approcci tradizionali. DeepSeekAI implementa ulteriormente tecniche di riduzione
della dimensionalità per gestire grandi insiemi di parole e frasi, riducendo l’overfitting e migliorando la generalizzazione.

Inoltre, il sistema impiega algoritmi di ottimizzazione avanzati, come Adam o RMSprop, per accelerare il processo di addestramento e garantire una convergenza più rapida. Questi algoritmi vengono
integrati con tecniche di regolarizzazione (ad esempio, dropout e weight decay) per prevenire l’overfitting e migliorare la robustezza del modello.

Processo di Elaborazione dei Dati

La fase di elaborazione è essenziale per il funzionamento di DeepSeekAI. Il sistema inizia con una fase di preprocessing che include tokenizzazione, rimozione di stopwords e normalizzazione lessicale.
Questi passaggi sono progettati per ridurre la complessità del dato ingresso e migliorare l’efficienza del processamento.

Successivamente, i dati vengono analizzati attraverso layer neurali specializzati nella estrazione di caratteristiche. Questa fase utilizza tecniche di embedding per convertire parole e frasi in vettori
numerici, permettendo al sistema di catturare significato contestuale. L’estrazione di pattern è supportata da reti convolutive che identificano strutture locali e globali all’interno dei dati.

Infine, il sistema utilizza tecniche di classificazione o regressione per generare output significativi. Questa fase è caratterizzata da un alto livello di personalizzazione, in grado di adattarsi a
diverse tipologie di task, dalla classificazione testuale alla predizione di valori numerici.

Modelli di Machine Learning

DeepSeekAI implementa modelli di machine learning avanzati progettati per gestire complessi problemi di classificazione e regressione. Uno degli elementi chiave è l’utilizzo di tecniche di transfer
learning, che consentono al sistema di riutilizzare conoscenze acquisite su task differenti per migliorare le sue prestazioni su nuove attività.

Ad esempio, DeepSeekAI può adattare modelli pre-addestrati su corpus linguisticamente ricchi (come Wikipedia o libri) per risolvere problemi specifici, come la classificazione di commenti social media o
l’analisi sentiment. Questo approccio riduce significativamente il tempo e i costi associati all’addestramento di modelli da zero.

Inoltre, il sistema impiega tecniche di ensembling per combinare predizioni provenienti da diversi modelli, migliorando la robustezza e la precisione delle risposte. Questo approccio è particolarmente
utile in contesti in cui la decisione finale richiede un alto livello di fiducia.

DeepSeek, geopolitica tra Microsoft, AMD, Huawei e sanzioni di Trump

Il panorama dell’intelligenza artificiale sta vivendo una trasformazione senza precedenti, con la Cina che avanza rapidamente nel settore grazie a DeepSeek, un modello AI che ha dimostrato di poter competere con OpenAI, riducendo drasticamente i costi computazionali. Parallelamente, AMD e Huawei stanno accelerando l’adozione di DeepSeek sulle loro piattaforme hardware, mentre gli Stati Uniti, sotto una possibile amministrazione Trump, potrebbero introdurre tariffe del 25% – 100% sui chip prodotti a Taiwan, colpendo direttamente TSMC e l’intera supply chain globale dell’AI.

Questa analisi approfondisce questi eventi e il loro impatto sul mercato globale dell’intelligenza artificiale e dei semiconduttori.

AMD integra DeepSeek su Ryzen AI e GPU Radeon

AMD ha annunciato ufficialmente il supporto per DeepSeek R1 sui suoi processori Ryzen AI e GPU Radeon RX 7000, consentendo agli utenti di eseguire modelli AI localmente con maggiore efficienza.

I punti chiave dell’integrazione includono:

  • Compatibilità con Ryzen AI e Radeon tramite driver Adrenalin 25.1.1.
  • Ottimizzazioni per Ryzen 8040 e 7040, con supporto fino a modelli DeepSeek Distill-Llama-14B.
  • Supporto per GPU Radeon RX 7600 XT fino a DeepSeek-R1-Distill-Qwen-14B e per RX 7900 XTX fino a DeepSeek-R1-Distill-Qwen-32B.

L’obiettivo di AMD è offrire agli utenti un’alternativa più accessibile per eseguire LLM direttamente sui propri dispositivi, senza dipendere dal cloud. Questo potrebbe rappresentare una sfida per Nvidia, che domina il mercato delle AI con le sue GPU.

Pat Gelsinger (ex CEO di Intel) e la scelta di DeepSeek su OpenAI

L’adozione di DeepSeek non si limita all’hardware: Pat Gelsinger, ex CEO di Intel, ha dichiarato che la sua nuova startup Gloo utilizzerà DeepSeek anziché OpenAI per il proprio chatbot AI.

Le ragioni della scelta:

  • DeepSeek è open-source, mentre OpenAI limita l’accesso tramite API.
  • Costi di addestramento e inferenza drasticamente ridotti (DeepSeek ha richiesto 11 volte meno potenza computazionale rispetto ai modelli di Meta).
  • Possibilità di eseguire modelli su hardware cinese come Huawei Ascend, riducendo la dipendenza dai fornitori statunitensi.

Questa decisione dimostra come DeepSeek stia ridefinendo il mercato AI, attirando sempre più startup e sviluppatori alla ricerca di soluzioni più efficienti ed economiche.

Huawei adotta DeepSeek per le sue GPU Ascend AI

Un altro passo importante verso l’autonomia tecnologica cinese è stato l’annuncio di Huawei, che ha ottimizzato il modello DeepSeek R1 per le sue GPU Ascend AI, riducendo ulteriormente la dipendenza da Nvidia e AMD.

Annunci
image 423
DeepSeek via dagli Store, ma le BigTech la usano: ecco perchè 9

Ascend 910C, la GPU AI più potente di Huawei, ora offre prestazioni che raggiungono il 60% di un Nvidia H100. Questo potrebbe avere implicazioni geopolitiche significative, soprattutto considerando le restrizioni USA sulle esportazioni di chip avanzati in Cina.

Tariffe USA sui chip di Taiwan: un terremoto per TSMC

L’ex presidente Donald Trump ha annunciato che, in caso di rielezione, imporrà tariffe dal 25% al 100% sui chip prodotti a Taiwan, colpendo duramente TSMC, principale fornitore di processori per aziende come Apple, Nvidia, AMD e Qualcomm.

Le conseguenze di questa decisione potrebbero essere enormi:

  • Aumento dei costi di produzione per CPU, GPU e ASIC, con un impatto immediato su PC, smartphone e server AI.
  • Maggiore pressione su aziende come TSMC per costruire nuove fabbriche negli USA, nonostante i costi elevati e i tempi lunghi di realizzazione (3-4 anni per una fab di ultima generazione).
  • Possibile accelerazione dell’indipendenza tecnologica cinese, con Huawei e altre aziende che investono sempre più su soluzioni nazionali.

Sebbene gli Stati Uniti vogliano ridurre la loro dipendenza da Taiwan, la costruzione di nuove fabbriche richiede miliardi di dollari e anni di sviluppo, rendendo difficile un cambio immediato nella supply chain globale.

Microsoft adotta DeepSeek su Windows Copilot+ PC: il segnale di una svolta?

image 422
DeepSeek via dagli Store, ma le BigTech la usano: ecco perchè 10

Microsoft ha confermato che DeepSeek R1 Distill sarà ottimizzato per girare localmente sui nuovi Copilot+ PC, grazie all’integrazione nel Windows Copilot Runtime (WCR). Questo significa che, per la prima volta, un modello AI open-source cinese avrà un’integrazione nativa in Windows, un sistema operativo utilizzato da oltre 1,4 miliardi di utenti.

Questa mossa è estremamente significativa perché indica una spinta verso AI locali ed efficienti, riducendo la dipendenza dal cloud e migliorando le performance su dispositivi con NPU dedicate.

Le caratteristiche principali dell’integrazione

  • DeepSeek R1 girerà direttamente su PC Windows, sfruttando il nuovo framework Windows Copilot Runtime.
  • Compatibilità iniziale con Snapdragon X e Intel Core Ultra 200V, con ottimizzazioni future anche per AMD Ryzen AI.
  • Possibilità di eseguire inferenza offline, riducendo costi e tempi di risposta rispetto a modelli basati su cloud.
  • Disponibilità attraverso Azure AI Foundry, rendendolo accessibile agli sviluppatori per test e applicazioni personalizzate.

Se questa integrazione si rivelasse un successo, potrebbe mettere in difficoltà OpenAI e Google, che finora hanno dominato il mercato grazie a modelli proprietari e costosi. Microsoft, che è il principale finanziatore di OpenAI, potrebbe quindi trovarsi divisa tra il supporto alla propria creatura e l’adozione di alternative più economiche come DeepSeek.

OpenAI accusa DeepSeek: furto di tecnologia o normale concorrenza?

OpenAI ha lanciato un’accusa pesante contro DeepSeek, sostenendo che il modello cinese sia stato addestrato utilizzando dati derivati da GPT-4.

Secondo OpenAI, DeepSeek avrebbe usato la distillazione di conoscenza, un metodo che consente di estrarre informazioni da un modello avanzato per allenare un modello più piccolo, riducendo i costi e il tempo di addestramento.

Le prove e le implicazioni legali

  • OpenAI ha bloccato diversi account sospetti che utilizzavano le API di GPT-4 in modo anomalo, raccogliendo dati su larga scala.
  • Microsoft, partner di OpenAI, ha confermato di aver rilevato attività anomale collegate a IP cinesi.
  • Il governo USA potrebbe aprire un’indagine, e se le accuse fossero confermate, DeepSeek rischierebbe blocchi su server cloud occidentali e restrizioni legali in Europa e USA.

Se DeepSeek ha effettivamente utilizzato GPT-4 come base, potrebbe subire limitazioni nel mercato occidentale, ma nel frattempo la Cina potrebbe accelerare i piani per rendere completamente autonoma la sua AI, evitando qualsiasi dipendenza dalle tecnologie americane.

Nvidia crolla ancora in borsa: sanzioni USA e effetto DeepSeek

NVIDIA logo
NVIDIA logo

Dopo aver perso 589 miliardi di dollari di valore nelle scorse settimane, Nvidia vede il suo titolo calare ulteriormente. A scatenare il panico tra gli investitori ci sono due fattori chiave:

  1. Il successo di DeepSeek, che dimostra che i modelli AI possono essere più economici ed efficienti, riducendo la necessità di super-GPU come le Nvidia H100.
  2. Le nuove restrizioni USA sui chip destinati alla Cina, che potrebbero includere non solo le versioni “depotenziate” delle GPU Nvidia, ma anche nuovi limiti all’esportazione di tecnologie avanzate di addestramento AI.

Le voci su sanzioni più severe contro la Cina da parte dell’amministrazione Trump hanno spinto gli investitori a vendere massicciamente azioni Nvidia, causando un crollo del 6,9% in un solo giorno, con il titolo sceso a 122$ per azione.

Il mercato AI e crypto in crisi: -2,5 miliardi in 24 ore

La rapida ascesa di DeepSeek ha avuto ripercussioni non solo sul settore hardware e software AI, ma anche sul mercato finanziario e delle criptovalute.

Nelle ultime 24 ore, la capitalizzazione complessiva degli investimenti AI è scesa da 12,9 miliardi a 10,2 miliardi di dollari, segnando un crollo del 19%.

Chi ha perso di più?

  • AIXBT -18,5%, uno dei principali progetti AI su blockchain.
  • ai16z framework -24%, un’infrastruttura AI decentralizzata.
  • GRIFFAIN -25%, che sviluppa agenti AI virtuali.
  • Fartcoin -31%, un meme token legato a progetti AI.

Il mercato delle criptovalute legate all’intelligenza artificiale ha subito un duro colpo perché molti investitori ritengono che le valutazioni AI tradizionali fossero gonfiate. Il modello di DeepSeek, più economico e accessibile, ha messo in dubbio la necessità di finanziamenti miliardari per sviluppare nuove soluzioni AI.

L’adozione di DeepSeek da parte di AMD e Huawei dimostra come il panorama dell’intelligenza artificiale stia rapidamente evolvendo verso modelli più efficienti e meno dipendenti dalle grandi piattaforme cloud. Allo stesso tempo, le politiche commerciali USA potrebbero innescare un cambiamento significativo nella produzione di semiconduttori, spingendo aziende come TSMC, Nvidia e Apple a rivedere le proprie strategie. Mentre la battaglia tra DeepSeek e OpenAI continua a intensificarsi, il futuro dell’AI e dei semiconduttori sarà fortemente influenzato dalle decisioni politiche e dagli investimenti in hardware proprietario.

Si può anche come

MatriceDigitale.it – Copyright © 2024, Livio Varriale – Registrazione Tribunale di Napoli n° 60 del 18/11/2021. – P.IVA IT10498911212 Privacy Policy e Cookies

Developed with love by Giuseppe Ferrara