Google PlaNet non ha bisogno dei metadati

Per un software in grado di leggere i metadati di un’immagine relativi al GPS, è molto facile capire dove la foto è stata scattata. Ma Google ha messo a punto un programma, PlaNet, in grado di capirlo anche senza metadati.

Come si legge su MIT Technology Review, il sistema non è ancora perfetto, ma nel gioco online GeoGuesser, che consiste appunto nell’indovinare su una mappa luoghi visti su StreetView, ha comunque offerto prestazioni superiori ai giocatori umani e senza nemmeno richiedere troppi MB di memoria.

Questo è stato possibile perché Tobias Weyand di Google e il suo team hanno diviso la mappa del mondo in 26.000 quadrati, più o meno grandi a seconda del numero di immagini prese in quei luoghi, ignorando i poli e gli oceani di cui vengono scattate pochissime foto.

Quindi, hanno creato un enorme database di 126.000.000 di immagini prese da Internet, accompagnate dai relativi dati Exif di geolocalizzazione, usandoli per determinare in quale punto della loro griglia erano state scattate.

Il team di ricerca ha poi usato 91 milioni di queste immagini per insegnare a una potente rete neurale a riconoscere un punto della griglia utilizzando solo la sua immagine.

Perché sprecare tempo per una ricerca del genere, dal momento che esiste il GPS?
Evidentemente, perché gli investimenti sull’intelligenza artificiale sono sempre più cospicui e lo studio delle reti neurali e dei sistemi di visual recognition fanno parte di questi progetti.


Pubblicato

in

da

Translate »