Open Images Dataset

Da un paio di giorni è disponibile un enorme dataset contenente le URL di circa 9 milioni di immagini classificate in oltre 6000 categorie.

Un vero e proprio patrimonio per chi si occupa di apprendimento supervisionato. Le annotazioni sono rilasciate da Google con licenza CC BY 4.0 mentre le immagini con la CC BY 2.0.

 

Il materiale è molto corposo: oltre 600 MB per i link alle immagini e 330 MB per le annotazioni a livello di immagini. Il dataset è già partizionato per training e validation.

Sul repository Github (da cui è possibile avviare il download) sono presenti ulteriori dettagli e un paio di grafici sulla distribuzione delle etichette.

Se vi interessano ulteriori dataset potete consultare questo elenco (in progress).

Lascia una risposta

L'indirizzo email non verrà pubblicato. I campi obbligatori sono contrassegnati *

Utilizzando il sito, accetti l'invio dei cookies da parte nostra. Maggiori informazioni

Questo sito utilizza i cookies per fornire la migliore esperienza di navigazione possibile. Continuando ad utilizzarlo senza modificare le impostazioni o cliccando su "Accetta" acconsenti al loro utilizzo.

Chiudi