Sicurezza Informatica
Web Scraping: Reuters fa un’esclusiva? No, l’ha fatta Matrice Digitale
Diverse aziende di AI ignorano gli standard web per effettuare web scraping senza licenza, sollevando questioni etiche e legali
Reuters dichiara di aver fatto un’esclusiva ed ha ragione perché non legge Matrice Digitale, non ha interesse nel farlo e magari non sa nemmeno che esiste. Qualche settimana fa, tre precisamente, la nostra redazione ha denunciato la presenza massiccia di BOT delle società AI che hanno iniziato un’attività di Scraping al nostro sito web per acquisire quanti più dati. Operazione legittima, ma che dovrebbe seguire delle regole di licenza e di tempo ed invece i modi sembravano quelli di un attacco di tipo DDOS per la quantità di informazioni.
Diverse aziende di AI Ignorano gli Standard Web per il Web Scraping Senza Licenza
Un recente rapporto di Reuters ha evidenziato come diverse aziende di intelligenza artificiale stiano aggirando gli standard web per effettuare il web scraping dei siti dei publisher senza ottenere le necessarie licenze. Questo fenomeno solleva importanti questioni etiche e legali riguardo all’uso dei dati online.
Web Scraping e Licenze
Il web scraping è una tecnica utilizzata per estrarre dati da siti web. Sebbene possa essere legittimo se fatto con il permesso del proprietario del sito, molte aziende di AI stanno bypassando gli standard del protocollo robots.txt, che indica ai motori di ricerca e agli scraper quali pagine possono essere visitate. Ignorando queste direttive, queste aziende accedono e utilizzano i contenuti senza autorizzazione.
Implicazioni Legali ed Etiche
Questo comportamento solleva numerose problematiche:
- Violazione dei Diritti d’Autore: I publisher investono risorse significative nella creazione di contenuti. L’uso non autorizzato dei loro dati rappresenta una violazione dei diritti d’autore.
- Impatto Economico: Il web scraping senza licenza può ridurre i ricavi pubblicitari dei publisher, poiché i contenuti vengono utilizzati senza generare traffico verso i siti originali.
- Questioni di Privacy: La raccolta massiccia di dati può includere informazioni personali, sollevando preoccupazioni sulla privacy e la protezione dei dati.
La risposta del Settore
Le aziende di AI coinvolte sostengono che il web scraping sia essenziale per addestrare i modelli di intelligenza artificiale, che richiedono grandi quantità di dati per migliorare le loro prestazioni. Tuttavia, molti esperti legali e professionisti del settore ritengono che queste pratiche debbano essere regolamentate per garantire un uso equo e rispettoso dei dati.
L’aggiramento degli standard web per il web scraping senza licenza da parte delle aziende di AI rappresenta una sfida significativa per il settore. È necessario un equilibrio tra l’innovazione tecnologica e il rispetto dei diritti dei creatori di contenuti. Regolamentazioni più rigorose e un dialogo aperto tra le aziende di AI e i publisher potrebbero essere la chiave per affrontare queste problematiche.