[發明專利]一種頻率極值和均值結合的聲紋過濾方法在審

申請號：	201611029653.8	申請日：	2016-11-22
公開（公告）號：	CN106782568A	公開（公告）日：	2017-05-31
發明（設計）人：	胡平	申請（專利權）人：	合肥星服信息科技有限責任公司
主分類號：	G10L17/04	分類號：	G10L17/04
代理公司：	暫無信息	代理人：	暫無信息
地址：	230051 安徽省合肥市包河***	國省代碼：	安徽;34
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種頻率極值均值結合聲紋過濾方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

技術領域

本發明屬于聲波通訊領域，是一種通過采集聲譜圖的頻率極值和均值結合對聲紋數據進行初步過濾的方法。

背景技術

聲紋的識別作為一項可靠的技術在人們日常生活中發揮越來越重要的作用。例如可以通過聲紋識別犯罪分子，聲紋也可以用來考勤，門禁出入管理等。

但是都有一個共同的問題，聲紋數據采集量大，比對模型運算量大，反應速度慢，影響實際使用中用戶體驗。特別是應用于廣大民用設備上的時候，方便快捷是使用過程中必須要考慮的問題。

目前解決的主要技術包括：

1、利用一個人鼻音、帶深呼吸音、沙啞音、笑聲等輔助判斷；

2、利用受社會經濟狀況、受教育水平、出生地等影響的語義、修辭、發音、言語習慣等輔助判斷；

3、利用個人特點如韻律、節奏、速度、語調、音量等特征。

發明內容

本發明的目的是提供一種通過聲譜圖的最高頻率、最低頻率以及頻率均值對聲紋數據進行初步過濾的方法。簡單易用，初步過濾快速。所述方法包括：

1、首先將目標樣本（說話人）的語音生成一個聲譜圖，記錄說話人聲音；

2、將這段語音按照一定時間段（如0.1秒）進行分割，分為很多幀；

2、分析每一幀聲譜圖中最高頻率E1和最低頻率E2和平均頻率E3，并記錄保存；

4、對測試樣本中的所有語音進行步驟1-3的操作，得到每一幀的最高頻率E1`和最低頻率E2`和平均頻率E3`：

5、計算測試樣本和目標樣本E1、E2、E3之間的偏差，小于設定的閾值為合格樣本，不合格的樣本將直接剔除。這樣減少聲紋比對模型的運算量，提高識別效率。

本發明提供了一種聲紋識別的過濾方法，其創新點包括：

1、提取目標樣本聲譜圖的極值和均值數據進行初步過濾；

2、分析每一幀聲譜圖中非空最高頻率、最低頻率和頻率均值作為對比數據。

附圖說明

圖1 是本發明目標用戶數據提取示意圖；

圖2 是本發明聲譜圖比對流程示意圖；

圖3 是本發明目標用戶數據提取流程圖。

具體實施方式

結合附圖給出本發明的一個具體實施例。

本發明的目的是提供一種通過提取目標用戶聲譜圖中非空的最高頻率、最低頻率和均值，來進行聲紋識別前的初步篩選，降低聲紋模型的計算量，提高聲紋識別效率。

首先，我們警察通過聲紋識別的場景。

罪犯張三（目標用戶）說了一段話，我們通過錄音設備記錄下來，首先形成頻譜圖，然后按照一定時間段（如0.1秒）進行分割，分為很多幀。通過FFT變換形成聲譜圖。

我們對每一幀的非空頻率（即這個頻率段有聲強數據），提取其最大頻率、最小頻率，并對所有非空頻率進行平均得到頻率均值。假設得到的數據為：

0-0.1秒這一幀 {最高頻率，最低頻率，均值}為{3500，1200 ，3000}

0.1-0.2秒這一幀 {最高頻率，最低頻率，均值}為{1500，200 ，1000}

…

2.9-3.0秒這一幀 {最高頻率，最低頻率，均值}為{4500，2200 ，3000}

將這些數據記錄下來，以備后面的對比運算。

現在有一批犯罪嫌疑人（測試用戶）的聲音數據，我們對其進行FFT變換分別提取每一個人的最高頻率，最低頻率，均值。

假設李四的數據為：

0-0.1秒這一幀 {最高頻率，最低頻率，均值}為{9500，3200 ，6000}

0.1-0.2秒這一幀 {最高頻率，最低頻率，均值}為{7500，1200 ，3000}

…

2.9-3.0秒這一幀 {最高頻率，最低頻率，均值}為{14500，2200 ，9000}

王五的數據為：

0-0.1秒這一幀 {最高頻率，最低頻率，均值}為{3700，1100 ，2800}

0.1-0.2秒這一幀 {最高頻率，最低頻率，均值}為{1600，300 ，1000}

…

2.9-3.0秒這一幀 {最高頻率，最低頻率，均值}為{4800，2000 ，4000}

計算犯罪嫌疑人的數據和罪犯數據的方差，(E1`-E1)²⁺(E2`-E2)²⁺(E3`-E3)²。當其值小于設定值（如10000）為合格數據，可以通過初步篩選。反之，直接排除，不參加后面的聲紋模型識別。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于合肥星服信息科技有限責任公司，未經合肥星服信息科技有限責任公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201611029653.8/2.html，轉載請聲明來源鉆瓜專利網。

上一篇：建立聲紋模型的方法和裝置
下一篇：一種基于聲紋注冊的增強現實方法及裝置

同類專利

專利分類

G 物理

G10 樂器；聲學
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L17-00 講話者辨認或驗證

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】