[發明專利]語音關鍵詞檢出系統、創建用于其的詞典的系統和方法有效
| 申請號: | 201110217287.X | 申請日: | 2011-08-01 |
| 公開(公告)號: | CN102915729A | 公開(公告)日: | 2013-02-06 |
| 發明(設計)人: | 郭莉莉;劉賀飛;亓超 | 申請(專利權)人: | 佳能株式會社 |
| 主分類號: | G10L15/08 | 分類號: | G10L15/08;G10L15/00;G06F17/30 |
| 代理公司: | 中國國際貿易促進委員會專利商標事務所 11038 | 代理人: | 卜榮麗 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 關鍵詞 檢出 系統 創建 用于 詞典 方法 | ||
技術領域
本發明涉及語音關鍵詞檢出(spotting)系統,以及創建用于該語音關鍵詞檢出系統的詞典的系統和方法。?
背景技術
語音關鍵詞檢出技術旨在檢測并且識別連續的或者分割的輸入語音中的預定義語音關鍵詞。語音關鍵詞檢出技術被用于幾乎所有語音識別應用中,如呼叫中心系統、語音郵件分類和按內容搜索。?
在實際的語音關鍵詞檢出應用中,輸入語音的大多數部分不包括關鍵詞。這些部分稱為集外詞(Out-Of-Vocabulary,OOV)段(即,非關鍵詞)。如果OOV段被錯誤地識別為關鍵詞,則這被稱為誤警(false?alarm,FA)。高誤警率會引起不良的用戶體驗。?
一般而言,丟棄OOV數據的方法之一是除了建立關鍵詞模型之外,還建立用于OOV數據的適當的垃圾模型(garbage?model),以區分關鍵詞和非關鍵詞。?
通常,關鍵詞的數量是有限的。建立對于每個關鍵詞的準確模型是相對容易的。而建立準確的垃圾模型是非常困難的,這是因為存在太多類型的OOV數據。例如,關于OOV數據,有靜音數據、語音數據和不同類型的噪聲等。建立垃圾模型的通用方法如下。?
(1)采用一個或更多個通用垃圾模型。?
例如,美國專利申請No.20030200090和No.20050256712以及Jay?G.Wilpon等人的“Automatic?Recognition?of?Keywords?in?Unconstrained?Speech?Using?Hidden?Markov?Models”,IEEE?Trans?on?Assp,Vol.38,No.11,November,1990,第1870-1878頁描述了通?過利用所有語音數據(具有或不具有關鍵詞樣本)和各種噪聲來建立一個通用垃圾模型的各種方式。H.Bourlard、B.D′hoore和JM?Boite,“optimizing?recognition?and?rejection?performance?in?word?spotting?systems”,Proc.ICASSP?94,第373-376頁描述了通過聚類的上下文無關的音子數據來建立若干個通用垃圾模型。?
這種方法易于操作并且對于提高通用語音關鍵詞檢出系統的性能是有效的。但是,這樣的通用垃圾模型是關鍵詞無關的。其不能在考慮特定關鍵詞的情況下良好地代表所有非關鍵詞的特性。具有與關鍵詞相似發音的OOV詞傾向于被識別為關鍵詞,因而導致大量的誤警。?
(2)采用關鍵詞相關的垃圾模型。?
建立與特定關鍵詞相關的垃圾模型將降低上述的誤警。例如,在美國專利No.5895448和No.6223155,以及J.Rohlicek、W.Russel、S.Rouko和H.Gish,“Continuous?hidden?Markov?modeling?for?speaker?independent?word?spotting”,in?Proc,Int.Conf.Acoustics,Speech,and?Signal?Processing,1989,第627-630頁和Makoto?Yamada、Tsuneo?Kato、Masaki?Naito和Hisashi?Kawai,”Improvement?of?Rejection?Performance?of?Speech?keyword?spotting?Using?Anti-Keywords?Derived?from?Large?Vocabulary”,in?INTERSPEECH2005,September,4-8,Lisbon,Portugal,第1445-1448頁中,提出了建立用于關鍵詞的垃圾模型的各種方式。?
這種方法良好地區分特定關鍵詞和OOV詞。但是,因為一個關鍵詞具有至少一個垃圾模型,因此在識別時將使用許多垃圾模型,這引起語音關鍵詞檢出系統的重的計算和存儲負荷。另一個缺點是一旦改變或增加關鍵詞,用于其的垃圾模型應當被重新建立和訓練。?
如何在使計算和存儲負荷保持低的同時有效地減小語音關鍵詞檢出的誤警率是語音關鍵詞檢出技術的挑戰。?
發明內容
本發明的目的是提供一種使用關鍵詞相關的垃圾模型的高度可靠的語音關鍵詞檢出系統,其能夠在不引起重的計算和存儲負荷的情況下提高垃圾模型的區分能力。?
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于佳能株式會社,未經佳能株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110217287.X/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種取料臂俯仰角度檢測裝置
- 下一篇:微機械磁場傳感器及其應用





