毋庸置疑,聲紋識別的市場潛力是可觀的。站在人工智能、生物識別這兩股強(qiáng)大的技術(shù)風(fēng)口之上,前有人臉識別,聲紋識別市場也正延續(xù)著人臉識別的發(fā)展路徑,在算法涌現(xiàn)、平臺崛起和場景化落地的歷程中兀自發(fā)展和演進(jìn)。這個(gè)過程也吸引著越來越多相關(guān)企業(yè)的入局,其中,擁有人工智能技術(shù)背景的企業(yè)成為聲紋識別賽道上的主要玩家。
為了更好地展開聲紋識別的技術(shù)應(yīng)用,正如人臉識別技術(shù)的落地路徑一樣,聲紋識別也正在經(jīng)歷著技術(shù)產(chǎn)品化、平臺化和場景化應(yīng)用的階段和流程。針對不同的應(yīng)用場景,市場上相關(guān)聲紋識別產(chǎn)品已經(jīng)具備了一定規(guī)模和多樣性,包括終端和平臺型產(chǎn)品,比如各類專用的聲紋采集設(shè)備、聲紋鑒定軟件系統(tǒng)以及聲紋布控系統(tǒng)平臺等。
聲紋識別正在歷經(jīng)產(chǎn)品化、平臺化和場景化落地
聲紋的采集、識別、鑒定等環(huán)節(jié)同樣也是廠商核心技術(shù)的比拼環(huán)節(jié)。由于聲音不同于視頻圖像信息,它是動態(tài)的且無形的,那么,如何實(shí)現(xiàn)聲紋的采集和識別分析處理呢?此前筆者特別采訪了微納感知計(jì)算技術(shù)有限公司 CTO 王丹,據(jù)王丹表示,聲紋采集其實(shí)跟視頻圖像的采集是類似的方式,只不過視頻以幀為單位,而聲音是連續(xù)的。當(dāng)然,復(fù)雜場景下的聲紋采集和識別分析依然存在一定挑戰(zhàn),首先要將聲音從復(fù)雜環(huán)境中清晰的采集下來,其次要分析聲音中所包含的信息內(nèi)容。
目前市場上的聲紋采集終端設(shè)備主要采用的是麥克風(fēng)陣列,通過麥克風(fēng)陣列信號處理技術(shù)實(shí)現(xiàn)高保真錄音、定向拾音、回聲消除、噪聲&混響抑制等,將聲音信息從復(fù)雜環(huán)境聲中清晰采集下來之后通過專業(yè)的聲紋鑒定系統(tǒng)完成聲紋的識別分析處理,助力公安、司法、金融、信貸、社保等行業(yè)的身份認(rèn)證應(yīng)用。
同時(shí),隨著聲紋識別在安全防范領(lǐng)域應(yīng)用的逐漸深入,一些專業(yè)的警用聲紋采集器、公安動態(tài)聲紋布控系統(tǒng)等也成為公安部門稽查布控,維護(hù)公共安全的有效技術(shù)手段,這也預(yù)示著聲紋識別相關(guān)產(chǎn)品已經(jīng)被納入到了公安部安全與警用電子產(chǎn)品的范圍。聲紋識別技術(shù)的加持,使得智慧安防建設(shè)增加了一個(gè)新的維度。
毋庸置疑,聲紋識別的市場潛力是可觀的。站在人工智能、生物識別這兩股強(qiáng)大的技術(shù)風(fēng)口之上,前有人臉識別,聲紋識別市場也正延續(xù)著人臉識別的發(fā)展路徑,在算法涌現(xiàn)、平臺崛起和場景化落地的歷程中兀自發(fā)展和演進(jìn)。這個(gè)過程也吸引著越來越多相關(guān)企業(yè)的入局,其中,擁有人工智能技術(shù)背景的企業(yè)成為聲紋識別賽道上的主要玩家。
像快商通、科大訊飛、SpeakIn、平安科技、遠(yuǎn)鑒科技等這一批在聲紋識別領(lǐng)域已經(jīng)有一定技術(shù)沉淀的企業(yè),目前都已經(jīng)在相關(guān)領(lǐng)域開拓出了一片屬于自己的聲紋識別市場,也奠定了聲紋識別在各行業(yè)領(lǐng)域的應(yīng)用基礎(chǔ),但這也并不影響后來者在聲紋識別領(lǐng)域的躍躍欲試。
從人臉到聲紋,CV企業(yè)的AI技術(shù)版圖擴(kuò)張
從近兩年在國際聲紋識別測試競賽中刷榜的企業(yè)還可以看出,一些原本專注于計(jì)算機(jī)視覺的AI企業(yè)也開始延伸了其人工智能技術(shù)研究觸角,從視覺領(lǐng)域跨越到聽覺領(lǐng)域,從人臉識別拓展到聲紋識別的技術(shù)研究,像依圖科技和澎思科技,都已經(jīng)圍繞著聲紋識別的算法和應(yīng)用展開了相關(guān)布局,并積極推進(jìn)聲紋識別技術(shù)和計(jì)算機(jī)視覺技術(shù)在已開拓領(lǐng)域的融合應(yīng)用。
而計(jì)算機(jī)視覺領(lǐng)域的相關(guān)企業(yè)之所以朝機(jī)器聽覺領(lǐng)域延展,可以推測有幾方面的原因:
1)看好聲紋識別技術(shù)發(fā)展?jié)摿?,搶先布局。作為人工智能的技術(shù)分支之一,機(jī)器聽覺的技術(shù)應(yīng)用市場潛力同樣巨大,既可以作為視覺AI身份認(rèn)證核心技術(shù)的補(bǔ)充,同時(shí)又因?yàn)槁暭y識別的獨(dú)特優(yōu)勢,可以拓展在更多細(xì)分場景的應(yīng)用機(jī)會。越早著手聲紋識別的技術(shù)研究,將越有可能在未來技術(shù)應(yīng)用爆發(fā)之際搶占市場先機(jī);
2)依托計(jì)算機(jī)視覺方面的技術(shù)研究經(jīng)驗(yàn)和市場資源,順勢進(jìn)軍聲紋識別市場。盡管聲紋識別和人臉識別在技術(shù)方向上大不相同,但其實(shí)兩者在技術(shù)研究的方式上有很大的相似之處?,F(xiàn)階段,無論是視覺AI還是聽覺AI的技術(shù)研究,仍然是以基于深度學(xué)習(xí)(DL, Deep Learning) 框架為主,在技術(shù)研究流程上基本都分為樣本采集、特征提取、特征建模、模型訓(xùn)練等環(huán)節(jié)。對于計(jì)算機(jī)視覺企業(yè)而言,此前在人臉識別技術(shù)研究上所積累的經(jīng)驗(yàn)可以為聲紋識別的技術(shù)研究奠定一定的經(jīng)驗(yàn)基礎(chǔ)。
3)拓寬人工智能技術(shù)資源池,完善AI場景落地方案,提升產(chǎn)品服務(wù)質(zhì)量。涉足聲紋識別技術(shù)研究和應(yīng)用,還有望為計(jì)算機(jī)視覺企業(yè)現(xiàn)階段已拓展的相關(guān)行業(yè)應(yīng)用輸出人臉識別+聲紋識別的視聽AI技術(shù)方案組合,完善智能安防、AIoT等場景的應(yīng)用需求,增強(qiáng)企業(yè)綜合競爭實(shí)力。
聲紋識別能否成長為下一個(gè)人臉識別市場?
盡管現(xiàn)階段,聲紋識別的市場體量遠(yuǎn)不及人臉識別,據(jù)前瞻網(wǎng)《2018年生物識別技術(shù)行業(yè)發(fā)展現(xiàn)狀與市場趨勢分析》數(shù)據(jù)顯示,人臉識別和聲紋識別在整個(gè)生物識別市場的占比分別為16%和11%,而這還只是2018年的數(shù)據(jù)。
隨著AI技術(shù)的日趨成熟,人臉識別市場在這兩年迎來了遍地開花的發(fā)展態(tài)勢,而從相關(guān)市場動態(tài)來推測,聲紋識別作為視覺AI的補(bǔ)充,也正在諸多應(yīng)用領(lǐng)域找到了落地應(yīng)用的機(jī)會,這些勢必會推動聲紋識別市場體量的增長。當(dāng)然,要實(shí)現(xiàn)大面積的落地應(yīng)用,參考人臉識別的落地經(jīng)歷,聲紋識別也或?qū)⒚媾R聲紋庫建設(shè)、芯片升級、強(qiáng)化算法模型泛化能力、標(biāo)準(zhǔn)和非標(biāo)場景的適用性等一系列的挑戰(zhàn)。聲紋識別能否成長為下一個(gè)人臉識別市場,我們靜待市場的自然發(fā)酵!