Princeton Undergrad Lumilikha ng Google Deep Dream-Inspired Deepjazz A.I. Maker ng Musika

Bob Ross - Deeply Artificial Trees - REACTION - Google AI Deep Dream

Bob Ross - Deeply Artificial Trees - REACTION - Google AI Deep Dream
Anonim

Ginugol ni Ji-Sung Kim ang mga oras ng umaga ng unang katapusan ng buwan ng Abril na naka-wire sa caffeine at coding sa kanyang computer habang lumilikha siya ng deepjazz, isang malalim na pag-aaral ng generator ng musika. Ang 20-anyos na Princeton computer science sophomore ay mayroon lamang 36 oras upang makumpleto ang deepjazz sa panahon ng kanyang unang hackathon, HackPrinceton, na ginanap noong Abril 1-3 sa unibersidad. Pagkatapos ng isang marathon ng coding, lumikha siya ng isang website para sa deepjazz, at nai-post ang source code sa GitHub.

Ngunit marami sa sorpresa ni Kim, ang programa ay bumagsak. Ang Deepjazz ay patuloy na nagte-trend sa Python at GitHub - umaabot bilang mataas na bilang nangungunang ikapitong programa sa GitHub sa pangkalahatan. Ito ay kahit na itinampok sa front page ng HackerNews at pa rin ang pagbuo ng isang buhay na buhay na talakayan.

"Hindi ko inaasahan na ang aking unang bahagi ng proyekto ay maging ito paputok sa mga tuntunin ng pagiging popular," Sinabi ni Kim Kabaligtaran. "Ito ay medyo mabaliw at masaya."

deepjazz - Malalim na pag-aaral na hinihimok ng jazz generation gamit ang Keras & Theano! http://t.co/G5wscglzO7 #python

- Pagpipili ng Python (@pythontrending) Abril 11, 2016

Sa pagitan ng pagkain, pagtulog, at pagkumpleto ng iba pang mga coursework, si Kim ay nagpasiya na kinuha niya ito nang halos 12 oras upang mapalawak ang source code para sa deepjazz. Gayunpaman, siya ay dumating up sa mga ideya para sa isang artificial intelligence music generator katagal bago HackPrinceton. Sa isang summer internship sa University of Chicago, nakilala niya ang Deep Dream ng Google, isang generator ng larawan na nagpapaliwanag ng mga pattern sa isang imahe at binago ang mga ito sa iba pang mga bagay na alam nito. Ang resulta ay mga larawan na mukhang lumabas sila ng isang ligaw na panaginip.

"Ang ideya ng paggamit ng malalim na pag-aaral upang bigyang-kahulugan ang sining ay talagang kawili-wili sa akin," sabi ni Kim. "Ang ganitong uri ng balangkas ng Deep Dream na ipinakita at inilathala ng Google ay talagang kamangha-manghang dahil ikaw ay lumilikha ng mga nobelang piraso ng sining mula sa mga umiiral na likhang sining."

Gumagamit ang Deepjazz ng machine-learning upang makabuo ng jazz music - "isang A.I. na binuo upang gumawa ng jazz "bilang mga estado ng SoundCloud profile nito. Si Kim, na hindi nakuha ang mga klase sa teorya ng musika ngunit pinatugtog ang klarinete sa loob ng pitong taon, ay pinili ang musika ng jazz dahil sa hindi kinaugahang mga melodie nito. Isang A.I. ang sistema ng musika, "ay maaaring magkaroon ng ilang mga hindi pangkaraniwang output, kaya sa palagay ko ang jazz ay lalong angkop sa ideya ng pagbuo ng musika sa mabilisang," sabi niya.

Binago niya ang isang umiiral na generator ng musika na na-optimize para sa jazz music na tinawag ng kanyang kaibigan na si Evan Chow na tinatawag na JazzML, gamit ang code upang makakuha ng may-katuturang data ngunit binago ito sa isang binary matrix na katugma sa dalawang malalim na pag-aaral ng mga aklatan na Keras at Theano.

Ang deepjazz framework mismo nito ay isang dalawang-layer na LSTM, na isang uri ng artipisyal na arkitektura ng neural network, ang inilalarawan ni Kim. Matapos matutunan nito ang isang paunang baseline seed sequence ng musikal na tala (ginamit ni Kim ang mga bahagi ng "And Then I Knew" ni Pat Metheny), nagtatakda ito ng mga probabilidad sa mga tala at bumubuo ng susunod na tala batay sa mga probabilidad na iyon. Halimbawa, kung pakanin mo ang programa ang laki ng A, B, C, mayroong isang mataas na posibilidad na ang susunod na tala deepjazz ay bubuo ay magiging D, sabi ni Kim.

Kasaysayan, sinabi ng mga kritiko na ang mga artificial intelligence music generators ay sinasadya sa pamamagitan ng paggawa ng mga awit na tunog na robotic at sterile - kulang ang kulay na naririnig sa musika na binubuo ng mga tao. Jeffrey Bilmes, isang dating mag-aaral ng MIT na nagsulat ng isang tesis sa mga computer na nagpaparami ng mga musikal na rhythms noong 1993, sinabi Kabaligtaran sa Nobyembre:

"Kapag natututo kang maglaro ng musika at natututo kang maglaro ng jazz, may isang utility sa intuitively pag-unawa kung ano ito tungkol sa musika na ginagawang tao," sabi ni Bilmes. "Ang mga tao ay matalinong mga nilalang, at kadalasan ay hindi maaaring ilarawan ng mga tao kung paano nila magagawang gawin ang mga bagay ng tao. Nadama ko sa oras na marahil ay nilabag ko ang isang sagradong panunumpa sa pagtukoy ng mga bagay na ito para sa mga programa sa kompyuter."

Nang si Kim ay gumagawa ng pananaliksik para sa deepjazz siya ay dumating sa maraming mga sistema na nakabuo ng musika na tunog robotic.

"Ang musika at sining ay mga bagay na itinuturing nating malalim na tao," sabi ni Kim. "Upang makagawa ito ng tunog na mas tao at mas parang buhay ay talagang uri ng mahirap upang maikategorya." Ipinakikita ni Kim na ang mga generator ay maaaring lumikha ng mga awit na tunog ng mas maraming tao sa pamamagitan ng pag-programming sa mga ito upang tunog mas katulad sa orihinal na track.

Ang iba pang mga developer ay nakipag-ugnayan kay Kim at interesado sa pagpapalawak ng deepjazz upang mas maraming tao ang maaaring makipag-ugnayan dito. Nakikita ni Kim ang deepjazz isang araw na umuunlad sa isang kasosyo sa improvisation na maaaring gumawa ng artipisyal na backtrack para sa isang musikero sa riff mula. Kahit na higit pa sa hinaharap, maaari niyang makita ang mga application na lumikha ng bago, katulad na tunog ng musika sa iyong mga paboritong track o na maaaring magmungkahi ng mga bagong chords at progressions para sa mga musikero.

Sinabi ni Kim na malayo pa siya sa pagiging isang dalubhasa sa malalim na pag-aaral, ngunit ang kanyang karanasan sa pagbuo ng deepjazz at pagsasanay sa mga internships at Princeton ay nagbigay sa kanya ng ilang mahahalagang pananaw sa larangan.

"A.I. ay hindi na isang panaginip na pang-agham. Ito ay isang bagay na napaka real at ito ay isang bagay na papalapit sa isang napakabilis na bilis, "sabi ni Kim. "Sana nakikita ko na ang mag-aaral sa kolehiyo na ito, sino pa man ay hindi isang upperclassman, ay nakagawa ng isang bagay sa loob ng isang hackathon ay naghihikayat sa iba pang mga mag-aaral na struggling upang makakuha ng sa agham ng computer."