Ang Speechmatics Gumagamit ng AI upang I-transcribe ang Mga Wika, at Pinupuntahan ang Google

$config[ads_kvadrat] not found

HINDI SIYA PINAPASOK ng SECURITY GUARD! HINDI NILA ALAM na SIYA ang CEO ng KUMPANYA

HINDI SIYA PINAPASOK ng SECURITY GUARD! HINDI NILA ALAM na SIYA ang CEO ng KUMPANYA
Anonim

Pupunta ang mga speechmatics pagkatapos ng Google. Kinuha ng British startup ang awtomatikong Linguist noong nakaraang buwan, isang malakas na artificial intelligence na maaaring matuto ng anumang wika para sa transcription sa pagsasalita sa text sa loob ng ilang araw. Nais ng koponan na paganahin ang teknolohiya para sa bawat isa sa humigit-kumulang na 7,000 wika sa mundo, na may potensyal na baguhin ang buhay.

Mula nang ilunsad ang tool ng wika, ang Speechmatics ay nagtatrabaho sa Omniglot, isang hamon na bumuo ng isang wika sa isang araw. Noong nakaraang linggo, ang kumpanya ay nagkaroon ng isang malaking milyahe: opisyal na pinalo ang Google, na may kabuuang 72 natatanging wika.

Ginagamit ng system ang pag-aaral ng machine upang tumugma sa data ng audio na may kasulatan ng kasulatan. Pagkatapos ay gumagamit ito ng mga linguistic pattern mula sa iba pang mga wika upang gawin ang proseso bilang direkta hangga't maaari, pagtukoy ng mga pagkakatulad sa pagitan ng mga tunog at gramatikal na mga istraktura at paglalapat sa mga ito sa mga bagong wika. Ang prosesong ito ay lubos na epektibo: bilang isang halimbawa, ang gawa ng Speechmatics 'sa Hindi ay tumatagal ng dalawang linggo upang maabot ang 80 porsiyentong katumpakan. Nang nasubok ang huling produkto laban sa mga pagsisikap ng Google, gumawa ito ng 23 porsiyento na mas kaunting mga pagkakamali.

Kabaligtaran nagsalita kay Benedikt von Thüngen, CEO ng Speechmatics, upang malaman ang higit pa.

Paano mo unang nagsimula ang pagtatrabaho sa proyekto?

Sinimulan namin ang proyekto na Omniglot bilang isang hamon sa ating sarili - upang makita kung gaano karaming mga wika ang maaari nating maitayo sa loob ng anim na linggo. Napagtanto namin sa isang sandali na ang tradisyonal na diskarte ng pagbuo ng bawat wika isa-isa ay hindi na maaaring mabuhay kapag naghahanap upang masukat sa isang mabilis na rate. Sa pag-iisip na iyon, kailangan nating muling isipin kung anong wika ang, kung paano ito nakabalangkas at kung ano ang pagkakatulad sa pagitan ng iba't ibang wika. Natagpuan namin ang isang paraan upang gamitin ang mga komonidad upang makilala ang mga pattern at tulungan ang aming balangkas na pinapatakbo ng AI, Automatic Linguist (AL), upang bumuo ng mga wika nang mas mabilis kaysa kailanman - 46 sa anim na linggo upang maging tumpak, o tungkol sa isang wika sa isang araw sa loob ng anim na linggo !

Paano naiiba ito sa mga pagsisikap ng Google?

Ang aming diskarte sa pagbuo ng wika ay isa sa mga pangunahing aspeto na nag-iiba sa amin mula sa Google. Habang inaakala namin na binuo nila ang kanilang mga wika nang paisa-isa (o sa tinatawag nating 'malupit na puwersa'), ginagamit namin ang kapangyarihan ng A.I. upang i-streamline at mapabilis ang proseso ng pagtatayo ng wika. Bukod pa rito, habang ang iba pang mga serbisyo tulad ng Google ay nakatuon sa pagbuo ng mga diyalekto kaysa sa mga natatanging wika, ipinagmamalaki nating sabihin na ang ating mga pagsisikap ay nakatuon sa mga natatanging wika mula sa buong mundo, kabilang ang mga lugar na dati nang hindi nakuha ng mga malalaking kumpanya ng teknolohiya.

Ano ang ilan sa mga real-world application para dito?

Mayroon na kami ngayon ng tech at kaalaman upang gawing mas malawak ang aming serbisyo kaysa sa dati at magdala ng awtomatikong pagsasalita pagkilala (ASR) sa lahat. Ito ay partikular na may kaugnayan sa mga bansa na may mababang antas ng pagbasa, kung saan ang kakayahang gamitin ang dating hindi magagamit na teknolohiyang speech-to-text upang makipag-usap ay maaaring gumawa ng lahat ng pagkakaiba para sa mga tao. Iba pang mga kaso sa real-buhay kung saan ang ASR na teknolohiya ay maaaring makatulong sa may kinalaman sa mga isyu ng accessibility - ang pandinig at / o kapansanan sa paningin ng mga tao mula sa lahat ng dako ng mundo ay maaari na ngayong gumamit ng isang aparato na kasing simple ng isang telepono upang makipag-ugnayan sa mga nakapaligid sa kanila.

Nagbabago ba ito sa katumpakan ng mahusay na sakop na mga wika tulad ng Ingles?

Habang nagpapatuloy kami sa pag-unlad ng higit pang mga wika, ang aming A.I. ang balangkas ay magiging lalong sanay sa pagkilala sa mga tampok at mga pattern ng wika. Gagamitin namin ang kaalaman na ito upang patuloy na malubos ang aming kasalukuyang wika base, kabilang ang Ingles.

Maaaring mapabuti ito ng isang bagay tulad ng mga tool sa pagsasalin sa real-time ng Google Pixel Buds?

Talagang makikita namin ang mga proyekto tulad ng Omniglot na tumutulong upang mapagbuti ang mga tool sa pagsasalin ng real-time na pasulong. Bilang mas mapagkukunan ay namuhunan sa pagpapalawak ng abot at katumpakan ng mga wika, makikita natin ang patuloy na pagpapabuti sa sektor ng mga serbisyo ng pagsasalin.

Nagtatrabaho ba ito sa anumang wika, kahit na itinayo na wika tulad ni Klingon?

Kailangan pa naming subukan at bumuo ng anumang mga conlangs, ngunit hindi namin makita ang anumang mga dahilan kung bakit hindi nila gagana. Samantalang ang mga wikang ito ay sinasalita pa rin ng mga tao, sinusunod din nila ang katulad na mga panuntunan at limitasyon ng struktura tulad ng mga pang-araw-araw na wika (tulad ng bilang ng mga phonemes), na magbibigay ng sapat na data ng AL para sa isang pagtatayo.

Binubuksan mo ba ang pagsasamantala sa proyekto?

Hindi, wala kaming mga plano para dito.

Paano gumagana ang paglilisensya?

Ang mga wika na inaalok sa ilalim ng proyekto Omniglot ay walang bayad at hindi maaaring gamitin para sa mga layuning pangkomersiyo. Kung gayon, hindi magkakaroon ng paglilisensya na nakalakip sa kanila para sa nakikinitaang hinaharap.

Ano ang mga susunod na hakbang mula dito?

Ang Project Omniglot ay simula lamang para sa amin. Gusto naming tuluyang bumuo ng bawat wika sa mundo, kaya't nagsusumikap kami patungo sa layuning iyon!

$config[ads_kvadrat] not found