Sommario
Databricks ha rilasciato Dolly 2.0, la nuova versione del suo Large Language Model (LLM) con interattività simile a ChatGPT, reso disponibile solo due settimane fa. Dolly 2.0 è il primo LLM open source e basato su un dataset trasparente e liberamente accessibile, utilizzabile anche per scopi commerciali senza dover pagare per l’accesso alle API o condividere dati con terze parti.
Caratteristiche distintive di Dolly 2.0
Secondo Ali Ghodsi, CEO di Databricks, sebbene esistano altri LLM utilizzabili a scopo commerciale, nessuno di questi è paragonabile a Dolly 2.0 in termini di interattività e possibilità di personalizzazione. Grazie alla licenza open source, gli utenti possono modificare e migliorare i dati di addestramento, creando una versione di Dolly adatta alle proprie esigenze.
Il dataset di addestramento e l’impegno per l’open source
Databricks ha rilasciato anche il dataset su cui Dolly 2.0 è stato perfezionato, chiamato databricks-dolly-15k. Si tratta di un corpus di oltre 15.000 record generati dai dipendenti di Databricks, pensato appositamente per migliorare l’interattività dei Large Language Model. L’azienda conferma il suo impegno nell’open source, rendendo disponibile il dataset per chiunque voglia sfruttarlo.
La rivoluzione degli LLM interattivi e il futuro di Dolly 2.0
Negli ultimi due mesi, sono stati rilasciati diversi LLM interattivi simili a ChatGPT, tra cui LLaMA di Meta e altri come Alpaca, Koala, Vicuna e la prima versione di Dolly di Databricks. Tuttavia, molti di questi modelli erano soggetti a limitazioni nell’uso commerciale a causa delle licenze dei dataset su cui erano stati addestrati.
Dolly 2.0, invece, è basato sulla famiglia di modelli open source Eleuther AI pythia e perfezionato esclusivamente su un corpus di record di istruzioni (databricks-dolly-15k) generato dai dipendenti di Databricks. Questo dataset può essere utilizzato per scopi sia accademici che commerciali.
Ali Ghodsi ritiene che Dolly 2.0 avvierà un “effetto valanga” nel settore, invitando altri a collaborare e proporre alternative. La rimozione del limite sull’uso commerciale apre nuove opportunità per l’intera comunità di sviluppatori e aziende interessate a sfruttare questi modelli.