人(rén)工智能之語音(yīn)識别,是語音(yīn)交互中最基礎的一個(gè)AI技(jì)術(shù)環節,常見的如siri,智能音(yīn)響等。
語音(yīn)識别(Automatic Speech Recognition)
簡稱ASR,是将聲音(yīn)轉化為(wèi)文字的過程。
語音(yīn)特點
(1)結構化API:高(gāo)度抽象的可(kě)擴展屬性API可(kě)通(tōng)過API自定義傳輸結構化信息,不局限于常見文本、語音(yīn)信息。
(2)秒(miǎo)秒(miǎo)到達:可(kě)選主動、被動信息傳輸模式,滿足信息實時(shí)更新、準時(shí)效率到達。
(3)傳輸安全:私有(yǒu)化傳輸協議結合分布式數(shù)據中心系統,系統上(shàng)保障信息服務的傳輸安全和(hé)一緻性。
應用場(chǎng)景
(1)語音(yīn)通(tōng)話(huà):互聯網語音(yīn)是基于IP網絡實現的點對點實時(shí)語音(yīn)通(tōng)話(huà)方式,通(tōng)過将模拟聲音(yīn)訊号(voice)數(shù)字化,以數(shù)據包的形式在IP網絡間(jiān)實時(shí)傳遞。
(2)語音(yīn)驗證碼:通(tōng)過API接口控制(zhì)平台以語音(yīn)播放驗證碼的方式校(xiào)驗用戶身份。
(3)語音(yīn)會(huì)議:基于互聯網網絡語音(yīn)多(duō)方語音(yīn)溝通(tōng)服務。