Maaari Bang Talaga Sinasabi ng "Superhuman" Neural Network ng Google ang Lokasyon ng Anumang Larawan?

$config[ads_kvadrat] not found

"The most embarrassing thing I've ever been on" - John Lennon and Paul McCartney Beatles Interview

"The most embarrassing thing I've ever been on" - John Lennon and Paul McCartney Beatles Interview
Anonim

Ang paghahanap ng mga larawan ay mas madali kaysa dati. Ngunit kung sinusubukan mong makahanap ng isang larawan ng isang bagay sa isang lokasyon na hindi lubos na halata (kaya hindi ang Egyptian pyramids o ang higanteng iskultura sa Paris), mas mahirap kaysa sa iniisip mo - kahit na may impormasyon sa geolocation batay sa kung ano ang sa larawan.

Pumasok sa Google engineer na may pangalang Tobias Weyand at isang pares ng kanyang mga kasamahan. Ayon sa isang bagong papel sa journal arXiv (binibigkas "archive"), ang trio ay nagtayo ng isang malalim na pag-aaral ng machine na may kakayahang pinpointing ang lokasyon ng halos anumang larawan batay lamang sa pagsusuri ng mga pixel nito.

Upang makakuha ng isang makina upang matagumpay na magawa ang isang gawain tulad nito, nais mong ibigay ito ng kakayahang mag-intuit ng impormasyon batay sa mga visual na pahiwatig. Gusto mo itong isipin, sa ibang salita, tulad ng isang tao.

Ang Weyand ay nagtakda tungkol sa pagbuo ng isang artipisyal na neural network - isang sistema ng makina na dinisenyo upang gayahin ang mga path ng neurological ng utak, na nagbibigay-daan upang matutunan, maproseso, at maalala ang impormasyon tulad ng isang tao. Ang bagong system na ito, PlaNet, ay tila may kakayahang lumabas ng mga tao sa pagtukoy ng mga lokasyon ng mga imahe kahit na ano ang setting - maging ito panloob o panlabas, at nagtatampok ng anumang uri ng natatangi o hindi nakikitang visual na mga pahiwatig.

Paano gumagana ang PlaNet? Hinati ni Weyand at ng kanyang koponan ang isang mapa ng mundo sa isang grid na inilagay sa ibabaw ng 26,000 square-like na mga hugis sa iba't ibang mga rehiyon, depende sa kung gaano karaming mga larawan ang kinuha sa mga lugar na iyon. Ang mga makapal na lugar kung saan ang maraming mga larawan ay kinuha magkasya sa isang mas maliit na parisukat, habang ang mas malaki, mas remote na mga rehiyon ay maaaring i-cut sa mas malaking mga parisukat.

Ang koponan pagkatapos ay lumikha ng isang malaking database ng mga imahe na geolocated - halos 126,000,000 iba't ibang mga larawan. Mga 91 milyon ang ginamit bilang isang dataset upang turuan ang PlaNet kung paano malaman kung anong larawan ang maaaring ilagay kung saan ang grid sa mapa ng mundo.

Pagkatapos, ang neural network ay tasked sa geolocating ang iba pang 34 milyong mga imahe mula sa database. Sa wakas, ang PlaNet ay nakatakda sa isang data set ng 2.3 milyong geotagged na imahe mula sa Flickr.

Ang mga resulta? Maaaring matukoy ng PlaNet ang bansang pinanggalingan para sa 28.4 porsiyento ng mga larawan at ang kontinente para sa 48 porsiyento. Higit pa rito, maaaring matukoy ng system ang isang lokasyon sa antas ng kalye para sa 3.6 porsiyento ng mga imaheng Flickr, at lokasyon ng antas ng lungsod para sa 10.1 porsyento.

At PlaNet ay mas mahusay sa ito kaysa sa karamihan ng mga tao - kahit na ang pinakamalaking globetrotters. Inilunsad ni Weyand ang 10 na indibidwal na manlalakbay upang makipagkumpetensya laban sa PlaNet sa isang laro ng mga lokasyon ng pag-label ng mga larawan na makikita sa Google Street View.

"Sa kabuuan, ang PlaNet ay nanalo ng 28 sa 50 rounds na may error sa lokalisasyon ng 1131.7 km, samantalang ang median na error ng lokalisasyon ng tao ay 2320.75 km," ayon sa mga mananaliksik. "Ipinakikita ng maliit na eksperimento na ito na ang PlaNet ay umaabot sa pagganap ng mahigit sa tao sa gawain ng geolocating ng mga tanawin ng Street View."

Ito bang tunay? Ang isang engineer ng Google ay talagang bumubuo ng isang "superhuman" A.I. sistema?

Pagdating sa mga geolocating na imahe, marahil. At diyan ay hindi lahat ng kamangha-mangha - ang punto ng A.I. ay hindi sa pangkalahatan ay gayahin ang utak ng tao sa lahat ng mga paraan, ngunit upang malampasan ang mga limitasyon ng tao sa ilang mga tiyak na paraan upang magawa ang mas mahirap na mga gawain. Kaya sa ganitong diwa, ang isinulat ng mga mananaliksik ay totoo.

Gayunpaman, ito ay isang kahabaan upang tawagin ang PlaNet isang "neural network." Ang isang perpektong anyo ng ganitong uri ng teknolohiya ay magiging kakayahang matuto nang higit pa kaysa sa geolocation ng imahe. A.I. Ang mga sistema ay may kakayahang magsulat ng mga simile at paglalaro Super Mario, ngunit ito ay maliit na bagay na inihambing sa isang perpektong "master" system na maaaring awtomatikong subaybayan at mapanatili ang mga mahahalagang bahagi ng katawan, pamahalaan ang transportasyon o imprastraktura ng enerhiya, at marami pang iba.

$config[ads_kvadrat] not found