[發明專利]一種電話聲紋識別音頻采集和有效音頻篩選的方法在審
| 申請號: | 202111280727.6 | 申請日: | 2021-11-01 |
| 公開(公告)號: | CN114040052A | 公開(公告)日: | 2022-02-11 |
| 發明(設計)人: | 陳萍;施道平;袁哲;陳輝 | 申請(專利權)人: | 江蘇號百信息服務有限公司 |
| 主分類號: | H04M3/42 | 分類號: | H04M3/42;G10L17/02;G10L17/04;G10L17/06 |
| 代理公司: | 南京天華專利代理有限責任公司 32218 | 代理人: | 許軻;夏平 |
| 地址: | 210000 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 電話 聲紋 識別 音頻 采集 有效 篩選 方法 | ||
本發明公開了一種電話聲紋識別音頻采集和有效音頻篩選的方法,首先需要獲取大量的處理后的通話錄音,進行聲紋算法模型訓練;其次需要在鑒權過程中提供實時錄音音頻,從而對通話中的用戶身份進行確認;具體步驟主要包括實時錄音獲取保存和訓練識別數據預處理兩個過程;其中,實時錄音獲取保存過程是對實時通話數據包進行轉發、解析和存儲,訓練數據預處理過程包含源數據獲取、有效錄音獲取、數據擴充和提取特征的過程。本發明解決了聲紋識別鑒別在實際的電話場景應用中實時錄音數據獲取困難以及角色分離的問題,以及解決了聲紋模型訓練識別數據預處理過程中,導致原始數據處理過后仍然質量較差的情況,顯著的提升了通話數據的質量。
技術領域
本發明涉及聲紋處理技術領域,具體涉及電話信道的實時錄音獲取和用于聲紋模型訓練識別的錄音數據預篩選處理方法。
背景技術
隨著信息技術和人工智能的不斷發展,商家提供的服務更加智能化、便捷化,電話端通話對話的交互不拘泥于人和人之前對話,智能語音機器人悄悄興起。智能語音機器人可以根據服務內容設計既定流程與用戶進行交互,為用戶帶來簡單、便捷的深入服務。隨著服務內容向個性化、私人定制化發展,無論是人工客服還是智能客服,都不可避免地會觸及到用戶隱私,為了防止不法分子冒名頂替用戶進行操作,需要對用戶進行身份確認,也就是鑒權,只有確認了用戶身份,才能進一步提供服務。眾所周知,一個人的生物特征,比如聲紋、指紋、掌紋、人臉、虹膜、手寫簽名等,可以唯一地確認身份。在應用驅動和通話場景的限制下,利用用戶的聲紋特征進行用戶識別鑒權相較于其他生物識別方式有更大的優勢。
聲紋訓練識別需要相應的算法和數據支撐,通話場景的鑒權服務需要系統具有高響應性,相較于小度、小愛等智能助手的面對面的聲音采集方式,電話信道更加復雜多變,聲音信息實時的采集也較為困難,通話雙方的角色分離也是一個必須考慮的問題,因此那就帶來了單角色通話錄音數據實時獲取的問題;此外,電話場景下的用戶對話存在語速過快、聲音過小、通話對話偏簡短句等情況,用現有的VAD(語音端點檢測)技術直接預處理數據,將會帶來數據清洗不干凈,或者清洗后的數據時長不夠,進而導致聲音特征不足問題;同時,現實場景下的通話環境并非安靜的錄音棚環境,常常伴有大量噪音,簡單的VAD常常不能很好地對通話錄音進行靜音切割,會保留大量雜音,這些都是影響聲紋模型訓練識別結果的重要因素,因此需要對這部分數據進行預篩選。同時,如何獲取實時通話錄音,接著采取一些篩選預處理策略以提高聲紋模型訓練識別的通話錄音數據質量成了一個亟待解決的問題。
發明內容
本發明的目的是提供一種電話聲紋識別音頻采集和有效音頻篩選的方法,具體是設計一個電話場景下,單角色通話錄音數據實時獲取并進行預處理篩取以用作聲紋模型的訓練和識別鑒別的等任務方法;本方法一是通過部署一個鏡像服務器實時獲取通話過程中發送的SIP、RTP數據包,從中解析并根據主被叫通話方向生成實時錄音文件,解決聲紋識別鑒別在實際的電話場景應用中實時錄音數據獲取困難以及角色分離的問題;二是利用ASR輔助篩選與減加噪相結合的方法解決了聲紋模型訓練識別數據預處理過程中,因為存在環境噪音、音頻頻率不匹配、用戶說話習慣等情況,導致原始數據處理過后仍然質量較差的情況,顯著提升通話數據的質量。
本發明采取的技術方案是:一種電話聲紋識別音頻采集和有效音頻篩選的方法,首先需要獲取大量的處理后的通話錄音,進行聲紋算法模型訓練;其次需要在鑒權過程中提供實時錄音音頻,從而對通話中的用戶身份進行確認;具體步驟主要包括實時錄音獲取保存和訓練識別數據預處理兩個過程;其中,實時錄音獲取保存過程是對實時通話數據包進行轉發、解析和存儲,訓練數據預處理過程包含源數據獲取、有效錄音獲取、數據擴充和提取特征的過程。
進一步的,所述實時錄音獲取保存過程包括:步驟一、數據流獲取;步驟二、數據解析;步驟三、數據轉發;具體步驟如下:
步驟一:數據流獲取,當用戶在進行通話,實時通話的數據信息通過一個中心網絡交換機進行轉發連接,此時一個鏡像服務實時從交換機中抓取轉發連接的每一通通話的數據包,發往語音服務器;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江蘇號百信息服務有限公司,未經江蘇號百信息服務有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111280727.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用于管理存儲系統中的緩存設備的方法和系統
- 下一篇:不經意訪問存儲系統





