[發明專利]公共背景噪聲下激活式的聲紋密碼安全控制方法及系統在審

申請號：	201710285878.8	申請日：	2017-04-27
公開（公告）號：	CN107172018A	公開（公告）日：	2017-09-15
發明（設計）人：	金亞強;殷瑞祥	申請（專利權）人：	華南理工大學
主分類號：	H04L29/06	分類號：	H04L29/06;G10L21/0208;G10L25/45
代理公司：	廣州市華學知識產權代理有限公司44245	代理人：	李斌
地址：	510640 廣***	國省代碼：	廣東;44
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	公共背景噪聲激活聲紋密碼安全控制方法系統
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

技術領域

本發明涉及智能家居的人機交互技術領域，尤其涉及一種公共背景噪聲下激活式的聲紋密碼安全控制方法及系統。

背景技術

隨著社會的發展，語音作為一種媒介出現在人機交互界面中，是社會發展的趨勢，相比其它任何一種人與人之間的交流方式來說，語音交流是一種快速的手段，語音識別已經慢慢滲透于我們日常生活當中，現在很多行業先驅相信借于語音進行人機之間的交互，會引向一個方便人們日常生活。

自動語音識別(Automatic Speech Recognition，ASR)技術自從二十世紀五十年代以來一直研究的主題。自動語音識別技術是一種將人的語音轉換為文本的技術。語音識別是一個多學科交叉的領域，它與聲學、語音學、語言學、數字信號處理理論、信息論、計算機科學等眾多學科緊密相連。由于語音信號的多樣性和復雜性，語音識別系統在人機交互領域的應用還不是很成熟，只有在特定的條件下獲得滿意的性能，或者說只能應用于特定的某些場合。

在智能家居給人們帶來便捷生活的同時，人們的控制習慣漸漸發生了改變。語音技術的發展也為控制入口做出了一個很好的補充，再拋去傳統遙控器和手機APP之后，通過語音指令的發送讓人們的生活更加便利。所謂智能語音主要是通過語音識別技術和語音合成技術為用戶提供各種服務。在語音控制技術方面，人們與機器進行語音交流，讓機器明白你說什么，這是人們長期以來夢寐以求的事情。試音識別技術就是讓機器通過識別和理解過程把語音信號轉變為相應的文本或命令的技術。

就目前語音識別的發展狀況，語音識別技術分為很多種模式，比如說按系統的用戶情況分為特定人和非特定人識別系統，按系統的詞匯量分為小詞匯量、中詞匯量和大詞匯量系統，按語音的輸入方式分為孤立詞、連接詞和連續語音系統等，按輸入語音的發音方式分朗讀式、口語式，按輸入語音的方言背景情況分為普通話、方言背景普通話、方言語音識別系統，按輸入語言的情感狀態分為中性語音、情感語音識別系統等等。但在高識別率的情況下只有通過特定的條件下才能實現。

現在設備的人機交互界面有鍵盤、圖像、指紋等方式，但是鍵盤操作有很多不方便。在特定環境下，比如汽車駕駛人員在駕駛的時候操作鍵盤要手眼并用，就無法注意到路面狀況，這就存在著交通隱患。對于某些身體殘疾或老人來說，界面式的操作都不是很方便，甚至是不可能的。

通信以及網絡的全球覆蓋使得信息公開化成為歷史必然，人們獲取資料的手段前所未有的豐富，然而負面影響也隨之而來。伴隨著信息透明化，個人隱私的安全性也受到了極大的威脅，相應的，如何正確進行個人身份的識別進而保護私人數據，是人機交互中一個亟待深入的課題。在個人身份識別中，傳統的文字密碼等保密手段存在著易被竊取和冒認的危險，而利用人本身的生物特征是相對比較可靠的一門技術。許多生物特征往往具有唯一性，如DNA、虹膜、指紋等等，這些特征不會改變；另一方面就是聲音在一定的時間間隔內相對穩定的特征。上述兩方面都可以作為識別的依據。聲紋密碼識別相對于指紋、虹膜識別來說，人聲的采集成本低廉、操作簡便，具有很好的通用性和獨特性；同時聲音帶有較強的個人特征，可以廣泛地普及到人們的日常生活領域中。

對于現狀的智能家居的語音控制在很多場景下因語音交互體驗不如人意而深受詬病，究其主要原因是受限于空間距離、背景噪聲、其他人聲的干擾、回聲、混響等多重復雜因素，進而出現識別距離近、識別率低、安全性能低的明顯缺點。現在大部分智能家居系統中的語音控制只是做到簡單的控制，忽略了其功效和安全性。

所以說在人機交互中的自然語言交互的公共背景噪聲下聲音拾取和安全性是兩個亟待深入研究的兩個課題。

發明內容

為了克服現有技術存在的缺點與不足，本發明提供一直公共背景噪聲下激活式的聲紋密碼安全控制方法及系統，解決了背景噪聲，其他人聲、回聲、混響低信噪比下對語音突發的增量進行定位拾取，通過三次安全語音識別及控制的操作解決上述現狀的問題。

為解決上述技術問題，本發明提供如下技術方案：一種公共背景噪聲下激活式的聲紋密碼安全控制方法，包括下述步驟：

S1、激活識別模塊在普通環境下實時進行語音信號監測，若檢測到語音信號，則對語音信號進行預加重、加窗和分幀處理，并求取語音信號的幅度值；根據實驗得到語音信號與噪聲之間的信噪比，并將信噪比轉化為幅度差T；設T為判決門限值，若語音信號的前一幀與后一幀只差大于等于T，則認為進入靜默期；若語音信號的前一幀與后一幀只差小于T，則判斷是激活標志，并激活聲源定位拾取模塊；

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于華南理工大學，未經華南理工大學許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201710285878.8/2.html，轉載請聲明來源鉆瓜專利網。