Inilunsad ng Microsoft Research ang Better-Than-Human Speech Recognition

$config[ads_kvadrat] not found

Using Microsoft Speech APIs

Using Microsoft Speech APIs
Anonim

Ang Microsoft ay naging unang kumpanya sa mundo upang bumuo ng speech recognition software na mas tumpak kaysa sa mga tao. Sa papel na "Pagkamit ng Pagkapantay-pantay ng Tao sa Pag-uusap sa Pag-uusap sa Pag-uusap" na inilathala ng Lunes, ang software ay gumawa ng mga transcript na naglalaman ng kalahati ng isang porsiyentong mas kaunting mga error kaysa sa mga pagsisikap ng tao, na hindi kapani-paniwalang isinasaalang-alang kung paano mahusay ang mga tao sa pag-unawa sa pagsasalita. Ang pambihirang tagumpay ay nagbukas ng pinto para sa bagong A.I. katulong na mas tumpak kaysa sa dati.

Ito ay kahanga-hanga kung gaano kalayo ang teknolohiya ay dumating sa tulad ng isang maikling puwang ng oras. Hindi pa masyadong matagal na ang pagkilala sa computer speech ay isang kakaibang angkop na lugar na tila walang pag-asa. Panoorin ang pagtatanghal ng software ng pagsasalita ng Windows Vista mula 2006:

Ginamit ng koponan ang National Institute of Standards and Technology (NIST) 2000 na pagsubok, na ginagamit sa buong industriya upang sukatin ang pagiging maaasahan ng mga transcription ng pagsasalita. Ang isang pag-uusap ay tumatagal ng lugar sa pagitan ng dalawang kalahok sa telepono, turn sa pamamagitan ng pagliko, bago ang nagreresultang script ay inihambing at sinusuri laban sa mga spelling ng diksyunaryo.

Sa bahagi ng switchboard, kung saan nagsasalita ang dalawang estranghero sa unang pagkakataon, ang rate ng error ng tao ay humigit-kumulang sa 5.9 porsiyento, habang nasa bahagi ng tawag sa bahay, kung saan ang dalawang taong nakakaalam ng bawat isa ay nagsasalita, ang error rate ay humigit-kumulang 11.3 porsiyento. Ang software ng Microsoft ay nakapuntos sa isang 0.4 na porsiyento na mas mababang rate ng error.

Ang pagtatagumpay ay makakatulong sa pagdadala ng mga bagong paraan ng immersive A.I.. Noong Agosto, kinuha ng mag-aaral na si Joshua Browder ang kanyang balot na DoNotPay, na makatutulong sa mga walang tirahan na makakuha ng libreng legal na payo. Kasama sa mga pagsulong sa pagkilala, madaling mag-larawan ng isang hinaharap kung saan humihiling ang mga tao ng isang virtual na katulong para sa tulong sa pabahay sa pamamagitan ng pagkakaroon ng regular na pakikipag-usap sa kanilang computer.

Sa yugtong ito, isinasaalang-alang ng mga mananaliksik kung paano maaaring makapagbigay ng mas matalinong mga tugon ang pinagkakatiwalaang pagsasalita ng A.I. Sensay, isang pagtuklas ng galit A.I. mula sa lab sa likod ng Siri, gumagamit ng mga advanced na kakayahan sa pagkilala upang makita kung ang isang user ay nagagalit o nalilito, na binabago ang mga sagot nito upang maging angkop sa sitwasyon. Ang pag-alis ng hadlang ng pagkilala ng boses na error-error, ay lumilikha ng mga kapana-panabik na bagong pagkakataon para sa virtual na tulong.

$config[ads_kvadrat] not found