OpenAI ha trascritto milioni di ore YouTube per GPT-4

da Livio Varriale Data di pubblicazione: 11 mesi fa

scritto da Livio Varriale Data di pubblicazione: 11 mesi fa 0 commenti 1 minuti leggi

OpenAI ha trascritto milioni di ore YouTube per GPT-4

OpenAI ha fatto un passo audace nel campo dell’intelligenza artificiale, utilizzando trascrizioni di oltre un milione di ore di video YouTube per addestrare GPT-4, il suo modello di linguaggio più avanzato. Questa mossa, sebbene potenzialmente controversa dal punto di vista legale, segna un importante progresso nel miglioramento delle capacità di comprensione e generazione del linguaggio delle AI.

Potreste Essere Interessati

Il mondo dell’intelligenza artificiale si trova di fronte a una crescente sfida: l’acquisizione di dati di addestramento di alta qualità. OpenAI, in risposta a questa necessità, ha sviluppato Whisper, un modello di trascrizione audio, per estrarre informazioni chiave da una vasta quantità di contenuti video su YouTube. Questa strategia mira a superare gli ostacoli legati alla carenza di dati utili, espandendo le frontiere di ciò che le AI sono in grado di apprendere e comprendere.

Annunci

Territorio legale incerto

L’uso di trascrizioni YouTube da parte di OpenAI per addestrare GPT-4 solleva questioni legali importanti, in particolare riguardo al diritto d’autore e alla proprietà intellettuale. Nonostante le potenziali controversie, l’azienda considera questa pratica un uso equo, sostenendo che tali dati contribuiscono significativamente all’avanzamento della ricerca globale nel campo dell’IA. Tuttavia, questo approccio apre un dibattito sull’etica e sulla legalità nell’utilizzo di contenuti generati dagli utenti per l’addestramento di modelli AI.

La risposta delle Big Tech

Google, proprietaria di YouTube, ha espresso preoccupazioni riguardo a queste pratiche, sottolineando che i termini di servizio e i file robots.txt di YouTube proibiscono esplicitamente lo scraping o il download non autorizzato dei contenuti. La tensione tra la necessità di dati per l’addestramento delle IA e il rispetto dei diritti di proprietà intellettuale pone una sfida significativa per le aziende tecnologiche e per l’intero ecosistema AI.

Potreste Essere Interessati

Livio Varriale

Giornalista e scrittore: le sue specializzazioni sono in Politica, Crimine Informatico, Comunicazione Istituzionale, Cultura e Trasformazione digitale. Autore del saggio sul Dark Web e il futuro della società digitale “La prigione dell’umanità” e di “Cultura digitale”. Appassionato di Osint e autore di diverse ricerche pubblicate da testate Nazionali. Attivista contro l’abuso dei minori, il suo motto è “Coerenza, Costanza, CoScienza”.

OpenAI ha trascritto milioni di ore YouTube per GPT-4

Territorio legale incerto

La risposta delle Big Tech

Si può anche come

Iscriviti alla Newsletter