Mga Computer na Siyentipiko Gusto Gumawa ng Robots Kalimutan ang Kanilang Masamang Data

Korea International Robot Contest 2014 - Rumble

Korea International Robot Contest 2014 - Rumble
Anonim

Kapag ang "masamang" data ay sinipsip sa isang sistema ng pag-aaral ng makina - ganito kung paano inilalagay ito ni Alan Greenspan kapag tinatalakay ang mga modelo ng computer na nabigo upang mahulaan ang 2008 na pag-urong - ang impormasyong iyon ay maaaring mahirap alisin. Ngunit ang isang bagong konsepto, na iminungkahi ng mga siyentipiko ng computer na si Junfeng Yang at Yinzhi Cao, ng Columbia University at Lehigh University, ayon sa pagkakabanggit, ay nagdudulot ng ideya na hindi maipaliwanag sa mga computer. Bilang Cao at Yang sumulat sa abstract-publish para sa 2015 IEEE Xplore pagpupulong, hindi mo na kailangang pumunta sa lahat ng mga paraan pabalik sa isang parisukat upang makalimutan:

Upang makalimutan ang isang halimbawa ng data ng pagsasanay, ang aming diskarte ay ina-update lamang ang isang maliit na bilang ng mga summation - asymptotically mas mabilis kaysa sa pagpapalit ng mga retraining mula sa simula. Ang aming diskarte ay pangkalahatan, dahil ang pagbubuo ng form ay mula sa statistical query sa pag-aaral kung saan maraming mga algorithm sa pag-aaral ng machine ay maaaring ipatupad. Nalalapat din ang aming diskarte sa lahat ng mga yugto ng pag-aaral ng machine, kabilang ang pagpili ng tampok at pagmomodelo. Ang aming pagsusuri, sa apat na magkakaibang sistema sa pag-aaral at workloads sa real-world, ay nagpapakita na ang aming diskarte ay pangkalahatan, epektibo, mabilis, at madaling gamitin.

Ang konsepto ng pag-aaral ng machine ay nakasalalay sa isang pundasyon na itinayo sa labas ng mga mound at mga tambol ng impormasyon. Makakatulong na magturo ng mga robot o artificial intelligence upang makagawa ng mga tiyak na koneksyon - tulad ng kung ang isang indibidwal na nasa isang mabigat na amerikana ay gumagamit ng palakol, siya ay maaaring maging isang firefighter. Ngunit sa mga sesyon ng pagsasanay, ang mga maling koneksyon ay maaaring lumitaw, batay sa hanay ng data. Ang iyong robot ay maaaring isipin na ang lahat ng mga bumbero ay may beards. Ito, malinaw naman, ay isang bagay na gusto mo ng isang computer hindi ikinagulat.

Cao at Yang base sa ideyang ito ng robotic informational uncoupling sa konsepto ng data lineage - ang data ay hindi spring ganap na nabuo sa mundo ngunit may isang traceable kasaysayan bilang raw data ay naproseso, mga tala Kurzweil A.I. Ang pagsasamantala sa lineage na ito ay nagpapahintulot sa mga machine na mag-unlearn na pumili ng mga bahagi ng data, nang walang ganap na pagwawalis ng kanilang edukasyon.