Bakit ang Reinforcement Learning Will Unlock Autonomous Cars para sa Misa

MIT 6.S094: Deep Reinforcement Learning for Motion Planning

MIT 6.S094: Deep Reinforcement Learning for Motion Planning
Anonim

Ang utak ng tao ay maaaring kumuha ng maraming impormasyon tungkol sa tanawin sa harap nito upang gumawa ng mga pagpapasya. Ang isang usa ay lumabas sa harap ng kotse? Slam sa preno. Ang isang kotse ay tumatagal nang maaga? Baguhin ang mga daanan.

Para sa mga autonomous na sasakyan, ang mga desisyon na ito ay hindi madali. Hindi namin maaaring magparehistro na ang aming mga talino ay pinoproseso pa ang lahat ng impormasyong kailangan upang gumawa ng aksyon, ngunit ang mga autonomous na sistema ay kailangang kumuha ng maraming mga variable sa account bago ilapat ang preno. Kung ang sistema ay hindi nagbabasa nang tama ang daan, maaaring magresulta ang mga nakamamatay na pag-crash. Isang kuwento na inilathala sa MIT's Review ng Teknolohiya sa Lunes ay naglalarawan kung paano ang automotive tech na kumpanya Mobileye ay gumagamit ng reinforcement pag-aaral upang sanayin ang artipisyal na katalinuhan sa likod ng mga autonomous na mga sasakyan. Ang pamamaraang ito ay nakasalalay sa data sa pagmamaneho ng real-world, at mas malaki ang hanay ng data, mas mabilis ang A.I. natututo kung paano maiiwasan ang mga pag-crash. May isang problema, bagaman. Ang mga kumpetensyang kompanya ng kotse ay ayaw na ibahagi.

Sa ngayon, ang mga inhinyero ng software ay dapat na account para sa bawat posibleng sitwasyon at programa ng kotse upang harapin ang mga ito. Ngunit sa totoong daigdig, ang mga kalsada ay isang mataas na pabago-bago at sari-saring kapaligiran. Walang paraan para maunawaan ng mga inhinyero ang lahat ng posibleng sitwasyon.

Kaysa sa mga kotse ng programa upang mahulaan ang bawat sitwasyon, ang mga engineer ay maaaring mag-program ng mga kotse upang malaman kung paano mag-navigate sa mga sitwasyon sa kanilang sarili. Ang reinforcement learning ay talagang nagsasanay ng mga autonomous na sasakyan sa pamamagitan ng pagbibigay ng magandang resulta. Pagkatapos mag-eksperimento at hindi pag-crash, natututo ang kotse kung ano ang gagawin sa iba't ibang sitwasyon at maaaring magamit iyon sa mga pangyayari sa hinaharap.

Ang susi sa reinforcement learning para sa autonomous na mga sasakyan, bagaman, ay ang data. Napakaraming at maraming data. Para sa mga kotse upang malaman ang tungkol sa lahat ng iba't ibang mga sitwasyon na maaaring ito ay maaaring makaharap, ang data na nakolekta sa tunay na mundo ay kailangang magamit sa software ng kotse para sa mga ito upang malaman kung ano ang dapat gawin.

Ang pagkuha ng mga kompanya ng kotse upang ibahagi ang kanilang data ay ang malaking hamon. Ang mga kakumpitensya ay hindi kilala para sa pagbabahagi ng kung ano ang gumagawa ng kanilang mga kotse tick. Ngunit kung binuksan nila ang kanilang data sa mga kumpanya tulad ng Mobileye, ang mga sasakyan na maaaring magmaneho sa kanilang sarili (kahit sa highway) ay magiging isang katotohanan ng mas maaga.