Ang Mga Pixelated na Mga Larawan ay Walang Tugma para sa Pagkilala sa Mukha ng Cornell Tech A.I.

$config[ads_kvadrat] not found

Convert Low-Res Graphic to High-Res in Photoshop

Convert Low-Res Graphic to High-Res in Photoshop
Anonim

Tatlong mananaliksik sa Cornell Tech sa New York City ang natuklasan na ang mga blur at pixelated na mga imahe ay hindi tumutugma sa artificial intelligence. Kahit na ang mga larawan na hindi tinatago ay hindi nauunawaan sa mga mata ng tao, at tila upang maprotektahan ang kanilang sensitibong nilalaman, kadalasan ay maaaring sabihin ng mga neural network kung sino talaga ang orihinal na larawan.

Sa ibang salita, ang mga tao ay hindi na ang litmus test. Hindi na tayo maaaring magtanong kung ang isang bagay ay natalo sa lahat ng talino ng tao. A.I.s - kahit na simpleng A.I.s - maaaring lumalabag sa mga tao, kaya ang pagkatalo sa mga ito, masyadong, ay dapat na laging bahagi ng equation.

Ang pag-aaral ng mga mananaliksik ng Cornell Tech ay nakatuon sa pagsubok ng mga algorithm na nagpapanatili ng privacy, na lumabo o nakapag-pixelate ng ilang impormasyon o mga bahagi ng mga larawan. Noong nakaraan, kami ay pinagkakatiwalaan ang software-algorithm na pinoprotektahan ng kalayaan sa katauhan, sa pag-iisip na ang impormasyon na kanilang natatakpan ay ligtas dahil walang tao maaaring sabihin kung sino ang nasa likod ng digital na belo. Ipinakikita ng pag-aaral na ang panahon ay tapos na, at ang mga kaugnay na pamamaraan ng anonymization ay hindi magtatagal. Ang mga neural network, na nakilala sa mga hakbang na ito sa pagkapribado, ay hindi nakilalang.

Si Richard McPherson ay isang Ph.D. kandidato sa agham ng computer sa University of Texas, Austin, na sumunod sa kanyang propesor, si Vitaly Shmatikov, kay Cornell Tech. Magkasama, kasama si Reza Shokri, ipinakita nila na ang simpleng mga network ng neural ay maaaring magbuka ng mga karaniwang mga diskarte sa pag-obscuscation ng imahe. Ang diskarteng ito ay relatibong hindi nakakaintindi, na ginagawang mas nakakalito ang pagtuklas: Ang mga ito ay pangkaraniwan, naa-access na mga pamamaraan, at nabigo nila ang mga pamantayan ng industriya para sa pagpupumilit.

Ang mga neural network ay malaki, layered na mga istruktura ng mga node, o mga artipisyal na neuron, na gayahin ang pangunahing istraktura ng utak. Ang mga ito ay "batay sa isang pinasimple na pag-unawa sa kung paano gumagana ang neurons," sabi ni McPherson Kabaligtaran. "Bigyan mo ito ng ilang input, at ang neuron ay alinman sa sunog o hindi sunugin."

Sila ay may kakayahang "pag-aaral," sa pamamagitan ng isang magaspang na kahulugan ng termino. Kung nagpapakita ka ng isang feral (ganap na walang pinag-aralan) na tao na isang bagay na "pula," at sabihin sa kanila na kunin ang lahat ng "red" na mga bagay mula sa isang bucket, magsisikap sila sa una ngunit mapabuti sa paglipas ng panahon. Gayundin sa mga neural network. Ang pag-aaral ng makina ay nangangahulugan lamang ng pagtuturo sa isang computer upang kunin ang mga "red" na mga bagay, halimbawa, mula sa isang virtual na bucket ng iba't ibang bagay.

Ganiyan kung paano sinanay ng McPherson at kumpanya ang kanilang neural network. "Sa aming sistema, lumikha kami ng isang modelo - isang arkitektura ng mga neural network, isang nakabalangkas na hanay ng mga artipisyal na neuron na ito - at pagkatapos ay binibigyan namin sila ng isang malaking halaga ng mga nabagong larawan," sabi niya. "Halimbawa, maaari naming bigyan sila ng isang daang iba't ibang mga larawan ni Carol na pixelated, pagkatapos ay isang daang iba't ibang mga larawan ni Bob na pixelated."

Ang mga mananaliksik pagkatapos ay lagyan ng label ang mga pixelated na imahe, at sa paggawa nito sabihin sa modelo na nasa bawat larawan. Pagkatapos maiproseso ang hanay ng data na ito, alam ng network na gumagana kung ano ang hitsura ng Pixelated Bob at Pixelated Carol. "Pagkatapos ay maaari naming bigyan ito ng isang iba't ibang mga pixelated na larawan ni Bob o Carol, nang walang label," nagpapaliwanag McPherson, "at maaari itong hulaan at sabihin, 'Sa tingin ko ito ay Bob na may 95 porsiyento katumpakan.'"

Ang modelo ay hindi muling itinatayo ang nababaluktot na imahe, ngunit ang katunayan na ito ay maaaring talunin ang pinaka-karaniwan at dating pinaka-maaasahang pamamaraan ng anonymization ay nakakalungkot sa at sa sarili nito. "Napag-alaman nila kung ano ang na-obfuscate, ngunit hindi nila alam kung ano ang orihinal na hitsura nito," sabi ni McPherson.

Ngunit ang mga neural network ay magagawa pa rin nang mas mabuti kaysa sa mga tao. Kapag ang mga imahe ay pinaka-obfuscated gamit ang isang industriya-standard na pamamaraan, ang sistema ay pa rin sa 50 porsiyento tumpak. Para sa bahagyang mas mababa obfuscated mga imahe, ang sistema proved kahanga-hangang, sa paligid ng 70 porsiyento kawastuhan. Nabigo ang pamantayan ng YouTube para sa mga malabo na mukha; kahit na ang pinaka-malabong mga imahe ay na-trounced sa pamamagitan ng neural network, na proved 96 porsiyento tumpak.

Ang iba pang mga hindi pa natapos na data, teksto, at mga diskarte sa anonymization ng imahe ay hindi rin maaasahan. "Nagkaroon ng isang trabaho sa tag-init na tumingin sa anonymizing teksto gamit ang pixelation at blurring, at nagpakita na sila ay magagawang nasira din," sabi ni McPherson. At ang iba pang mga mapagkakatiwalaan na paraan ay maaaring lumabas din sa pinto. Kahit na hindi niya alam ang mga in-out-ng mga diskarte ng obfuscation ng boses, tulad ng mga ginagamit para sa mga hindi nakikilalang mga panayam sa TV, siya ay "hindi magulat" kung ang mga neural network ay maaaring masira ang anonymization.

Ang pagtuklas ng McPherson, pagkatapos, ay nagpapatunay na "ang mga paraan ng pagpapanatili ng pagkapribado na mayroon tayo noon ay hindi talaga nakaka-snuff, lalo na sa mga makabagong pamamaraan sa pag-aaral ng makina." Sa madaling salita, nag-coding tayo sa mga walang kaugnayan, mga training machine labag sa amin sa lahat ng mga realms.

"Habang lumalaki ang lakas ng pag-aaral sa makina, ang tradeoff na ito ay magbabago sa pabor ng mga kaaway," ang mga mananaliksik ay sumulat.

$config[ads_kvadrat] not found