技術(shù)
導(dǎo)讀:目前,指紋識(shí)別、人臉識(shí)別已經(jīng)被大眾所熟知,但同樣作為生物識(shí)別的聲紋識(shí)別,還處于技術(shù)挑戰(zhàn)的前沿地帶。
生物識(shí)別技術(shù)作為新一代人工智能的重要領(lǐng)域,借助人體生理特征或行為特征進(jìn)行身份識(shí)別。近年來(lái)得益于云計(jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng)、深度學(xué)習(xí)等信息技術(shù)的快速發(fā)展,生物識(shí)別技術(shù)在基礎(chǔ)理論、算法模型、創(chuàng)新應(yīng)用、軟件支持等方面不斷取得突破。
目前,指紋識(shí)別、人臉識(shí)別已經(jīng)被大眾所熟知,但同樣作為生物識(shí)別的聲紋識(shí)別,還處于技術(shù)挑戰(zhàn)的前沿地帶。
據(jù)前瞻產(chǎn)業(yè)研究院分析,當(dāng)下全球生物識(shí)別產(chǎn)業(yè)規(guī)模龐大,僅語(yǔ)音生物識(shí)別(注:即聲紋識(shí)別)這一細(xì)分方向的市場(chǎng)規(guī)模就將近百億美元,預(yù)計(jì)2020 年更是有望超過(guò) 200 億美元(合 1346 億元人民幣),占整個(gè)生物識(shí)別市場(chǎng)的 22.4%。
從網(wǎng)絡(luò)身份認(rèn)證應(yīng)用領(lǐng)域來(lái)看,據(jù)國(guó)外權(quán)威調(diào)研機(jī)構(gòu) MarketsandMarkets數(shù)據(jù)顯示,2019 年網(wǎng)絡(luò)安全市場(chǎng)預(yù)計(jì)增長(zhǎng)至 1557.4 億美元,其中,身份認(rèn)證信息安全市場(chǎng)規(guī)模將超過(guò)300億美元。聲紋識(shí)別在其中也將扮演重要角色。
<電子發(fā)燒友>根據(jù)公開(kāi)資料統(tǒng)計(jì)出國(guó)內(nèi)20家聲紋識(shí)別企業(yè)。這些企業(yè)幾乎可以分為三大類,一是成立于2000年左右的以科大訊飛為代表的老牌語(yǔ)音廠商;二是成立于2000年~2010年的深耕聲紋技術(shù)的廠商;三是2012年之后借著AI東風(fēng)成立的初創(chuàng)企業(yè)。這些老牌企業(yè)往往掌握有深厚的技術(shù)積累和核心專利,特別是少數(shù)幾家有高校和科研機(jī)構(gòu)背景的企業(yè)。從融資進(jìn)度來(lái)看,AI初創(chuàng)企業(yè)步調(diào)更快,也從一定程度上反映出行業(yè)風(fēng)口機(jī)會(huì)的來(lái)臨。
國(guó)內(nèi)主要聲紋企業(yè)(<電子發(fā)燒友>整理)
聲紋識(shí)別主要應(yīng)用領(lǐng)域及場(chǎng)景
聲紋識(shí)別技術(shù)分支-應(yīng)用場(chǎng)景分布圖(圓圈越大代表成熟度越高)
(來(lái)源:中國(guó)首份聲紋識(shí)別產(chǎn)業(yè)發(fā)展白皮書(shū))
國(guó)家公共安全
聲紋辨認(rèn)技術(shù)首先在針對(duì)特定人群的國(guó)防安全、公安技偵、司法矯正等領(lǐng)域投入使用,有力保障了國(guó)家和公共安全。
泛金融
為防止盜刷等案件發(fā)生,將聲紋確認(rèn)技術(shù)加入到交易支付中,通過(guò)動(dòng)態(tài)聲紋密碼的方式進(jìn)行客戶端身份認(rèn)證,可有效提高個(gè)人資金和交易支付的安全。 2016到2018 年間,中國(guó)建設(shè)銀行、貴陽(yáng)銀行、蘭州銀行、西安銀行、中國(guó)銀聯(lián)、中國(guó)互金協(xié)會(huì)等多家單位上線了聲紋識(shí)別身份認(rèn)證服務(wù),用于賬戶登錄、大額轉(zhuǎn)賬、無(wú)卡取款、密碼找回等業(yè)務(wù)場(chǎng)景。微信和支付寶也已上線基于聲紋動(dòng)態(tài)口令的登錄方式。此外,在信貸業(yè)務(wù)中引入聲紋識(shí)別技術(shù)作為反欺詐手段,還可有效降低冒用他人身份進(jìn)行騙貸以及多頭貸款等事件的發(fā)生率。
社會(huì)保險(xiǎn)
城鄉(xiāng)養(yǎng)老保險(xiǎn)是社會(huì)保障體系的重要組成部分,目前我國(guó)社保面臨三個(gè)問(wèn)題: 加速進(jìn)入老齡化社會(huì),社保金管理存在冒領(lǐng)問(wèn)題,現(xiàn)有解決冒領(lǐng)問(wèn)題的方法成本高、效率低。利用聲紋識(shí)別技術(shù)有效解決參保人員的遠(yuǎn)程和現(xiàn)場(chǎng)的身份認(rèn)證問(wèn)題,避免了指紋和人臉等需現(xiàn)場(chǎng)辦理、不易采集、易偽造等問(wèn)題。
智能安防及個(gè)性化語(yǔ)音交互
利用聲紋確認(rèn)技術(shù),可完成個(gè)人日常生活中的各種事物訪問(wèn)控制的授權(quán),比如智能手機(jī)鎖屏、各類網(wǎng)絡(luò)賬號(hào)的聲控密碼鎖、電腦聲控鎖、聲控安全門(mén)、汽車聲控鎖等; 利用聲紋辨認(rèn)技術(shù),可支持智能音箱、智能語(yǔ)音助手等,針對(duì)不同年齡段的用戶提供個(gè)性化服務(wù)以及開(kāi)放特定的功能權(quán)限等;通過(guò)語(yǔ)音識(shí)別和聲紋識(shí)別技術(shù)的結(jié)合,完成多人會(huì)議記錄。
目前這些新興需求大部分還處在探索階段。
5G將催生聲紋識(shí)別全新應(yīng)用場(chǎng)景
在可預(yù)見(jiàn)的未來(lái),身份識(shí)別將會(huì)有以下趨勢(shì):多生物識(shí)別手段融合;能夠在自然情況下采集的非接觸式;能夠在互聯(lián)網(wǎng)上實(shí)現(xiàn)遠(yuǎn)程識(shí)別且不易造假的方式。每一種生物識(shí)別技術(shù)都有其優(yōu)勢(shì)和劣勢(shì),對(duì)于沒(méi)有屏幕和鍵盤(pán)或是屏幕非常小的智能硬件,語(yǔ)音是較為合理的操作方式,聲紋識(shí)別適用于這樣的驗(yàn)證方式和服務(wù)入口。
不過(guò),由于聲音信號(hào)的復(fù)雜性,聲紋識(shí)別在實(shí)際應(yīng)用時(shí)仍然面對(duì)很多挑戰(zhàn),根據(jù)清華大學(xué)人工智能研究院所撰寫(xiě)的《中國(guó)首份聲紋識(shí)別產(chǎn)業(yè)發(fā)展白皮書(shū)》,所提到的技術(shù)挑戰(zhàn)包括:
身份認(rèn)證(聲紋確認(rèn)):假冒攻擊、真實(shí)意圖檢測(cè)、低語(yǔ)識(shí)別等; 反欺詐(聲紋辨認(rèn)):多說(shuō)話人、短語(yǔ)音、語(yǔ)音掩蓋等; 文本無(wú)關(guān):(錄音重放的)假冒攻擊、短語(yǔ)音; 文本相關(guān):(錄音重放的)假冒攻擊; 文本提示:(錄音拼接重放)假冒攻擊; 共性:背景噪音、跨信道、時(shí)變(年齡變化)、身體狀況、(語(yǔ)速、音量、情感等)發(fā)音方式。
不過(guò),隨著5G 催生全新應(yīng)用場(chǎng)景,連接能力將增強(qiáng)至百億級(jí),帶來(lái)海量的機(jī)器類通信及連接的深度融合。同時(shí),網(wǎng)絡(luò)向云化、軟件化演進(jìn),加上高可靠、低時(shí)延、大容量的網(wǎng)絡(luò)能力,將使車聯(lián)網(wǎng)、物聯(lián)網(wǎng)、工業(yè)互聯(lián)網(wǎng)等領(lǐng)域獲得全新的技術(shù)賦能。語(yǔ)音作為最自然的人機(jī)交互方式,將迎來(lái)更多成長(zhǎng)機(jī)會(huì)和更大的發(fā)展空間。