[發明專利]一種可根據模型的提取頻率訓練識別模型的方法及系統有效
| 申請號: | 201610025278.3 | 申請日: | 2016-01-14 |
| 公開(公告)號: | CN106971734B | 公開(公告)日: | 2020-10-23 |
| 發明(設計)人: | 祝銘明 | 申請(專利權)人: | 芋頭科技(杭州)有限公司 |
| 主分類號: | G10L17/04 | 分類號: | G10L17/04;G10L17/02 |
| 代理公司: | 北京中原華和知識產權代理有限責任公司 11019 | 代理人: | 壽寧 |
| 地址: | 310000 浙江省杭州市余杭區*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 根據 模型 提取 頻率 訓練 識別 方法 系統 | ||
本發明公開了一種可根據模型的提取頻率訓練識別模型的方法及系統,屬于語音識別技術領域;可根據模型的提取頻率訓練識別模型的方法,采用服務器與客戶端遠程連接的方式進行數據通信,可將客戶端中不常用的通過比較初始識別模型的提取頻率,刪除不常用的初始識別模型,在服務器中采用語句訓練樣本對不常用的初始識別模型進行更新,減小了客戶端的運行負擔,同時提高了工作效率,能夠同時兼顧應用于一般智能終端中形成識別模型所需的較好的實用性以及聲紋識別所需的準確度。
技術領域
本發明涉及語音識別技術領域,尤其涉及一種可根據模型的提取頻率訓練識別模型的方法及系統。
背景技術
聲紋識別是一種利用人的聲音實現的識別技術,由于人在講話時使用的發聲器官存在一定的差異性,任何兩個人聲音的聲紋圖譜都有差異,所以聲紋可以作為表征個體差異的生物特征,因此可以通過建立識別模型來表征不同的個體,進而利用該識別模型識別不同的個體。目前識別模型的應用存在一個兩難的選擇,主要體現在訓練語料的長度選取上。一般而言,聲紋訓練的語料越長,建立的特征模型越精確,識別準確率也就越高,但是這種模型建立的方式的實用性不強;相反地,聲紋訓練語料較短,能保證較好的實用性,但相對而言其訓練生成的模型的識別準確率不高。而在實際應用中,例如應用到一些智能設備中進行語音操作的聲紋識別時,既要求有較高的識別準確率,又要求訓練語料不能太長,從而保證較好的實用性,則以現有技術中的聲紋識別模型建立的技術方案難以實現上述目的。
同樣地,現有技術中,需要由用戶手動多次錄入一定時長的訓練語料來輔助建立識別模型,因此會給用戶較差的體驗,不具備較高的實用性;組合起來的訓練語料的長度仍然有限,不能生成較精確的特征模型,識別準確率無法進一步提升;語速語調的變化、情緒波動等也都會影響模型建立的精確度;且聲紋識別模型建立的系統通常為獨立的客戶端,存儲的語句訓練樣本有限,且訓練速度慢,所以,如何在保證較高的實用性前提下,提高識別模型精確度,進而提高識別準確率是急需解決的問題。
發明內容
根據現有技術中存在的上述問題,現提供一種可根據模型的提取頻率訓練識別模型的方法及系統的技術方案,具體包括:
一種可根據模型的提取頻率訓練識別模型的方法,提供復數個客戶端和一服務器,所述服務器分別與復數個所述客戶端遠程連接,其中,所述方法包括:
所述客戶端獲取一說話人的初始語音信號流;
所述客戶端根據預設的說話人分割算法和說話人聚類算法,獲取所述初始語音信號流中的語音信號流;
所述客戶端判斷所有所述語音信號流中是否存在能夠作為識別對象的所述語音信號流,并將能夠作為識別對象的所述語音信號流作為識別信號流輸出;
所述客戶端將所述識別信號流與預先形成的復數個初始識別模型進行匹配,獲取匹配成功的所述初始識別模型;
所述客戶端所述識別信號流作為追加的識別信號流的語句訓練樣本,并獲取所述初始識別模型的提取頻率;
所述客戶端判斷所述提取頻率是否大于預設提取閾值,將小于或等于所述提取閾值的所述初始識別模型從所述客戶端中刪除;
所述客戶端依據所述語句訓練樣本對大于所述提取閾值的所述初始識別模型進行更新;
所述服務器中存儲有所有的所述初始識別模型,并依據所述語句訓練樣本對每個所述客戶端中小于或等于所述提取閾值的所述初始識別模型進行更新,最終形成多個識別模型,每個所述識別模型對應于一個所述說話人。
優選的,所述客戶端獲取一說話人的初始語音信號流之前還包括:
所述客戶端根據預設的復數個所述語句訓練樣本建立復數個所述初始識別模型。
優選的,所述客戶端根據所述說話人分割算法與所述說話人聚類算法,分別獲取所述初始語音信號流中的所述語音信號流的方法具體包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于芋頭科技(杭州)有限公司,未經芋頭科技(杭州)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610025278.3/2.html,轉載請聲明來源鉆瓜專利網。





