[發明專利]一種建立語言模型的方法、語音識別的方法及其裝置有效
| 申請號: | 201210050076.6 | 申請日: | 2012-02-29 |
| 公開(公告)號: | CN102623010A | 公開(公告)日: | 2012-08-01 |
| 發明(設計)人: | 萬廣魯 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L15/08 |
| 代理公司: | 深圳市威世博知識產權代理事務所(普通合伙) 44280 | 代理人: | 何青瓦;李慶波 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 建立 語言 模型 方法 語音 識別 及其 裝置 | ||
【技術領域】
本發明涉及自然語言處理技術,特別涉及一種建立語言模型的方法、語音識別的方法及其裝置。
【背景技術】
隨著搜索引擎技術和移動通訊技術的發展,如今采用語音搜索的方式獲取信息已經變得非常普遍。語音搜索不需要人們通過文字輸入即可發出搜索請求,使得人們能夠在運動狀態時也輕易獲取相關信息,給人們的生活帶來了極大的便利。
語音搜索中,首先需要對用戶的語音進行識別,只有準確地將用戶的語音表述識別成一致的語義文本,才能向用戶返回準確的檢索結果。而語音識別的結果依賴于在語音識別中使用的語言模型,現有的語音搜索中的語音識別系統,使用的語言模型一旦被訓練好,其中的參數通常不再改變,這樣的語言模型難以反映用戶檢索行為的變化,因此在面對用戶對一些熱點事件的語音搜索行為時,容易出現識別結果不準確的現象。例如現實生活中突發的某種事件,常被用戶冠名為“某某門”,這種“某某門”的搜索詞由于過去從來沒出現過,在現有的語言模型中出現的概率很低,因此最終語音識別系統對這種搜索詞的識別率就會降低。
【發明內容】
本發明所要解決的技術問題是提供一種建立語言模型的方法、語音識別的方法及其裝置,以解決現有的語音識別中語言模型不能隨著用戶的檢索行為發生改變從而導致識別率降低的問題。
本發明為解決技術問題而采用的技術方案是提供一種建立語言模型的方法,包括:獲取時效性搜索語料;利用獲取到的時效性搜索語料進行語言模型訓練,以得到時效性語言模型;將所述時效性語言模型與背景語言模型融合,以得到最終的識別語言模型,其中所述背景語言模型用于描述用戶的長期檢索行為。
根據本發明之一優選實施例,所述背景語言模型為已有的識別語言模型。
根據本發明之一優選實施例,獲取時效性搜索語料的步驟包括:從搜索引擎服務器上獲取最近的設定時間長度內的檢索日志并將獲取的檢索日志作為時效性搜索語料;或者,將在最近的設定時間長度內對用戶的語音搜索查詢的識別結果作為時效性搜索語料。
根據本發明之一優選實施例,在將所述時效性語言模型與所述背景語言模型融合時,將所述時效性語言模型中的參數與所述背景語言模型中的參數進行插值,以得到所述識別語言模型中的參數,其中所述參數為各N元詞組N-Gram的概率值。
根據本發明之一優選實施例,將所述時效性語言模型中的參數與所述背景語言模型中的參數進行插值時,對所述時效性語言模型中的參數進行加權。
本發明還提供了一種語音識別的方法,包括:獲取用戶的語音搜索查詢;使用前文所述建立語言模型的方法建立的識別語言模型對用戶的語音搜索查詢進行識別,得到識別結果。
根據本發明之一優選實施例,所述方法進一步包括:向用戶返回與所述識別結果相關的檢索結果。
根據本發明之一優選實施例,對用戶的語音搜索查詢進行識別的步驟包括:利用聲學模型將用戶的語音搜索查詢轉化為相應的音節序列;獲取與所述音節序列對應的一個以上的候選詞序列;使用所述識別語言模型計算每個候選詞序列在所述識別語言模型中出現的概率,并選擇出現概率最大的候選詞序列作為對用戶的語音搜索查詢的識別結果。
本發明還提供了一種建立語言模型的裝置,包括:獲取單元,用于獲取時效性搜索語料;訓練單元,用于利用獲取到的時效性搜索語料進行語言模型訓練,以得到時效性語言模型;融合單元,用于將所述時效性語言模型與背景語言模型融合,以得到最終的識別語言模型,其中背景語言模型用于描述用戶的長期檢索行為。
根據本發明之一優選實施例,所述背景語言模型為已有的識別語言模型。
根據本發明之一優選實施例,所述獲取單元獲取時效性搜索語料時,從搜索引擎服務器上獲取在最近的設定時間長度內的檢索日志并將獲取的檢索日志作為時效性搜索語料;或者,將在最近的設定時間長度內對用戶的語音搜索查詢的識別結果作為時效性搜索語料。
根據本發明之一優選實施例,所述融合單元在將所述時效性語言模型與所述背景語言模型融合時,將所述時效性語言模型中的參數與所述背景語言模型中的參數進行插值,以得到所述識別語言模型中的參數,其中所述參數為各N元詞組N-Gram的概率值。
根據本發明之一優選實施例,所述融合單元在將所述時效性語言模型中的參數與所述背景語言模型中的參數進行插值時,對所述時效性語言模型中的參數進行加權。
本發明還提供了一種語音識別的裝置,包括:接收單元,用于獲取用戶的語音搜索查詢;識別單元,用于使用前文所述建立語言模型的裝置建立的識別語言模型對用戶的語音搜索查詢進行識別,得到識別結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210050076.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種利用黑匣子獲取崩潰信息的方法、黑匣子及服務器
- 下一篇:受控的種子潤濕





