Google ha annunciato che Dataset Search – motore di ricerca che aiuta i ricercatori a individuare i dati online di 25 milioni di dataset liberamente disponibili per l’uso – non è più in beta.
Il motore di ricerca Google Dataset Search è stato lanciato il 5 settembre 2018 e l’azienda aveva spiegato che il prodotto fosse destinato a scienziati e studiosi di dati. Big G spiega che Dataset Search consente agli utenti di trovare “dataset” (un insieme di dati strutturati in forma relazionale) archiviati nel Web tramite una semplice ricerca per parola chiave. È possibile trovare le informazioni relative ai set di dati ospitati in migliaia di repository sul Web e rendere questi set di dati accessibili e utili a livello globale.
I ricercatori possono usare dataset di vario tipo, dal dettagli sui gatti nei Paesi Bassi dal 2010 al 2018, a elementi più interessanti con annotazioni audio e video che consentono di verificare ipotesi o addestrare e testare modelli per l’apprendimento automatico.
Con l’arrivo della versione definitiva, Dataset Search è disponibile anche in versione per dispositivi mobili e nuove funzionalità; la prima novità è la disponibilità di filtri che consentono di scegliere la tipologia di dati che si vogliono vedere (tabelle, immagini, testi, ecc.) semplificando la ricerca dei dati; la seconda novità è la disponibilità di maggiori informazioni sui dataset e le organizzazioni che hanno messo a disposizione queste informazioni.
Molti dei dati disponibili, spiega TechCrunch, provengono da agenzie governative. In totale Google riferisce che sono indicizzati 2 milioni di dataset del governo statunitense; è ad ogni modo possibile trovare regolarmente dati di Kaggle, consociata di Google, una community online di data scientist e machine learning consentendo di trovare e pubblicare set di dati, esplorare e costruire modelli.