Maaari Bang Talaga Sinasabi ng "Superhuman" Neural Network ng Google ang Lokasyon ng Anumang Larawan?

"The most embarrassing thing I've ever been on" - John Lennon and Paul McCartney Beatles Interview

Ang paghahanap ng mga larawan ay mas madali kaysa dati. Ngunit kung sinusubukan mong makahanap ng isang larawan ng isang bagay sa isang lokasyon na hindi lubos na halata (kaya hindi ang Egyptian pyramids o ang higanteng iskultura sa Paris), mas mahirap kaysa sa iniisip mo - kahit na may impormasyon sa geolocation batay sa kung ano ang sa larawan.

Pumasok sa Google engineer na may pangalang Tobias Weyand at isang pares ng kanyang mga kasamahan. Ayon sa isang bagong papel sa journal arXiv (binibigkas "archive"), ang trio ay nagtayo ng isang malalim na pag-aaral ng machine na may kakayahang pinpointing ang lokasyon ng halos anumang larawan batay lamang sa pagsusuri ng mga pixel nito.

Upang makakuha ng isang makina upang matagumpay na magawa ang isang gawain tulad nito, nais mong ibigay ito ng kakayahang mag-intuit ng impormasyon batay sa mga visual na pahiwatig. Gusto mo itong isipin, sa ibang salita, tulad ng isang tao.

Ang Weyand ay nagtakda tungkol sa pagbuo ng isang artipisyal na neural network - isang sistema ng makina na dinisenyo upang gayahin ang mga path ng neurological ng utak, na nagbibigay-daan upang matutunan, maproseso, at maalala ang impormasyon tulad ng isang tao. Ang bagong system na ito, PlaNet, ay tila may kakayahang lumabas ng mga tao sa pagtukoy ng mga lokasyon ng mga imahe kahit na ano ang setting - maging ito panloob o panlabas, at nagtatampok ng anumang uri ng natatangi o hindi nakikitang visual na mga pahiwatig.

Paano gumagana ang PlaNet? Hinati ni Weyand at ng kanyang koponan ang isang mapa ng mundo sa isang grid na inilagay sa ibabaw ng 26,000 square-like na mga hugis sa iba't ibang mga rehiyon, depende sa kung gaano karaming mga larawan ang kinuha sa mga lugar na iyon. Ang mga makapal na lugar kung saan ang maraming mga larawan ay kinuha magkasya sa isang mas maliit na parisukat, habang ang mas malaki, mas remote na mga rehiyon ay maaaring i-cut sa mas malaking mga parisukat.

Ang koponan pagkatapos ay lumikha ng isang malaking database ng mga imahe na geolocated - halos 126,000,000 iba't ibang mga larawan. Mga 91 milyon ang ginamit bilang isang dataset upang turuan ang PlaNet kung paano malaman kung anong larawan ang maaaring ilagay kung saan ang grid sa mapa ng mundo.

Pagkatapos, ang neural network ay tasked sa geolocating ang iba pang 34 milyong mga imahe mula sa database. Sa wakas, ang PlaNet ay nakatakda sa isang data set ng 2.3 milyong geotagged na imahe mula sa Flickr.

Ang mga resulta? Maaaring matukoy ng PlaNet ang bansang pinanggalingan para sa 28.4 porsiyento ng mga larawan at ang kontinente para sa 48 porsiyento. Higit pa rito, maaaring matukoy ng system ang isang lokasyon sa antas ng kalye para sa 3.6 porsiyento ng mga imaheng Flickr, at lokasyon ng antas ng lungsod para sa 10.1 porsyento.

At PlaNet ay mas mahusay sa ito kaysa sa karamihan ng mga tao - kahit na ang pinakamalaking globetrotters. Inilunsad ni Weyand ang 10 na indibidwal na manlalakbay upang makipagkumpetensya laban sa PlaNet sa isang laro ng mga lokasyon ng pag-label ng mga larawan na makikita sa Google Street View.

"Sa kabuuan, ang PlaNet ay nanalo ng 28 sa 50 rounds na may error sa lokalisasyon ng 1131.7 km, samantalang ang median na error ng lokalisasyon ng tao ay 2320.75 km," ayon sa mga mananaliksik. "Ipinakikita ng maliit na eksperimento na ito na ang PlaNet ay umaabot sa pagganap ng mahigit sa tao sa gawain ng geolocating ng mga tanawin ng Street View."

Ito bang tunay? Ang isang engineer ng Google ay talagang bumubuo ng isang "superhuman" A.I. sistema?

Pagdating sa mga geolocating na imahe, marahil. At diyan ay hindi lahat ng kamangha-mangha - ang punto ng A.I. ay hindi sa pangkalahatan ay gayahin ang utak ng tao sa lahat ng mga paraan, ngunit upang malampasan ang mga limitasyon ng tao sa ilang mga tiyak na paraan upang magawa ang mas mahirap na mga gawain. Kaya sa ganitong diwa, ang isinulat ng mga mananaliksik ay totoo.

Gayunpaman, ito ay isang kahabaan upang tawagin ang PlaNet isang "neural network." Ang isang perpektong anyo ng ganitong uri ng teknolohiya ay magiging kakayahang matuto nang higit pa kaysa sa geolocation ng imahe. A.I. Ang mga sistema ay may kakayahang magsulat ng mga simile at paglalaro Super Mario, ngunit ito ay maliit na bagay na inihambing sa isang perpektong "master" system na maaaring awtomatikong subaybayan at mapanatili ang mga mahahalagang bahagi ng katawan, pamahalaan ang transportasyon o imprastraktura ng enerhiya, at marami pang iba.

NASA Sabi Ang Pinakabagong Pag-usisa Rover Ang mga larawan ay kasing Nice ng Anumang National Park

NASA ay seryoso pakiramdam ang sarili nito sa paglalarawan nito sa mga pinakabagong mga imahe mula sa Kuryusidad Mars Rover nito. Sa paglalarawan ng mga larawang ito, na kinuha ng rover noong Setyembre 8 sa panahon ng paggalugad nito sa Murray Buttes sa Mars, sumulat ang NASA, "Ang mga bagong larawan ay may arguably karibal na mga larawan na kinunan sa U.S. National Parks." Halika sa NASA, ...

Ito Neural Network Maaari Gumawa ng iyong malabo Images Perpektong Marka Muli

Tatlong mga siyentipiko ng computer ang lumikha ng isang neural network na maaaring ibalik ang mga nasira na imahe sa kanilang buong resolution nang hindi nangangailangan ng isang malaking dataset.

Paano Ginagamit ng mga Tao ang Mga Larawan ng Google upang Gumawa ng "Idiot" Ipakita ang Mga Larawan ng Trump

Tulad ng malamang na nakita mo sa Twitter, ang mga resulta ng paghahanap ng Imahe ng Google para sa "ungas" ay puno ng mga larawan ni Donald Trump. Iyon ay higit sa lahat ang kasalanan ng balita media, ngunit adamantly tumangging i-play ng Google na may sariling mga resulta ng paghahanap, kahit na ang mga ito ay blatantly racist at antisemitic.