[發明專利]一種單兵聲紋識別系統、方法、存儲介質及電子設備有效
| 申請號: | 202110433538.1 | 申請日: | 2021-04-22 |
| 公開(公告)號: | CN112992152B | 公開(公告)日: | 2021-09-14 |
| 發明(設計)人: | 白世杰;王敏樂;吳富章;趙宇航;王秋明 | 申請(專利權)人: | 北京遠鑒信息技術有限公司 |
| 主分類號: | G10L17/00 | 分類號: | G10L17/00;G10L17/02;G06K9/62 |
| 代理公司: | 北京超凡宏宇專利代理事務所(特殊普通合伙) 11463 | 代理人: | 劉鳳 |
| 地址: | 100000 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 單兵 聲紋 識別 系統 方法 存儲 介質 電子設備 | ||
1.一種單兵聲紋識別系統,其特征在于,所述單兵聲紋識別系統包括:聲紋庫建立模塊、語音采集模塊、語音清洗模塊、聲紋特征提取模塊以及聲紋比對模塊;
語音采集模塊,用于獲取待識別對象的多條初始音視頻文件,確定所述多條初始音視頻文件的文件獲取方式,并將所述文件獲取方式發送至語音清洗模塊;
語音清洗模塊,用于按照所述文件獲取方式所對應的文件處理方式,對所述多條初始音視頻文件進行清洗,確定出屬于所述待識別對象的目標音視頻文件,并將所述目標音視頻文件發送至聲紋特征提取模塊;
聲紋特征提取模塊,用于根據所述目標音視頻文件,確定所述待識別對象的聲紋特征向量,并將所述待識別對象的聲紋特征向量發送至聲紋比對模塊;
聲紋比對模塊,用于分別確定所述待識別對象的聲紋特征向量與本地微型聲紋庫中的每個候選聲紋向量之間的聲紋相似度,針對于確定出的每個聲紋相似度,若該聲紋相似度位于預設閾值范圍內,則將該聲紋相似度對應的候選聲紋向量,確定為目標聲紋向量,并顯示所述目標聲紋向量所屬嫌疑人員的人物身份信息,其中,所述本地微型聲紋庫是根據從中心網絡聲紋庫中選取的候選聲紋向量預先構建好的;
當所述文件獲取方式為直接獲取時,所述語音清洗模塊具體用于:
在與待識別對象進行對話時,通過聲紋采集儀采集待識別對象的聲音數據,通過USB線從聲紋采集儀中下載并保存待識別對象的聲音數據,直接確定為目標音視頻文件;
當所述文件獲取方式為非直接獲取時,所述語音清洗模塊具體用于:
獲取每條初始音視頻文件的文件名稱;基于獲取到的每條音視頻文件的文件名稱,從所述多條初始音視頻文件中確定出多條目標音視頻文件;所述聲紋特征提取模塊具體用于:針對每一個目標音視頻文件,確定該目標音視頻文件對應的聲紋特征向量;將確定出的多個聲紋特征向量進行聚類處理,確定每個目標音視頻文件對應的聲紋特征向量所屬的聲音聚類類別;
根據每個聲音聚類類別中所包括的聲紋特征向量的數量,將聲紋特征向量數量最多的聲音聚類類別確定為目標聚類類別,并將所述目標聚類類別中全部聲紋特征向量的平均值,確定為所述待識別對象的聲紋特征向量。
2.根據權利要求1所述的單兵聲紋識別系統,其特征在于,所述單兵聲紋識別系統還包括聲紋庫建立模塊,所述聲紋庫建立模塊用于:
從中心網絡聲紋庫中選取候選聲紋向量,并根據所述候選聲紋向量建立本地微型聲紋庫。
3.根據權利要求1所述的單兵聲紋識別系統,其特征在于,所述聲紋比對模塊具體用于:
針對于每個候選聲紋向量,確定所述待識別對象的聲紋特征向量與該候選聲紋向量之間的歐拉距離值;
將所述歐拉距離值確定為所述聲紋特征向量與該候選聲紋向量之間的聲紋相似度。
4.根據權利要求1所述的單兵聲紋識別系統,其特征在于,所述單兵聲紋識別系統還包括聲紋管理模塊,所述聲紋管理模塊用于:
若未確定出所述目標聲紋向量,則將所述待識別對象的聲紋特征向量存儲于所述本地微型聲紋庫中。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京遠鑒信息技術有限公司,未經北京遠鑒信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110433538.1/1.html,轉載請聲明來源鉆瓜專利網。





