[發明專利]語音識別設備和方法有效
| 申請號: | 201611078946.5 | 申請日: | 2016-11-30 |
| 公開(公告)號: | CN106816148B | 公開(公告)日: | 2022-04-22 |
| 發明(設計)人: | 李知炫 | 申請(專利權)人: | 三星電子株式會社 |
| 主分類號: | G10L15/197 | 分類號: | G10L15/197;G10L15/193;G10L15/16;G10L15/26 |
| 代理公司: | 北京銘碩知識產權代理有限公司 11286 | 代理人: | 張川緒;胡江海 |
| 地址: | 韓國京畿*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 設備 方法 | ||
提供一種語音識別設備和方法。一種語音識別設備,包括:預測器,被配置為基于已被之前搜索的單詞序列預測跟隨已被之前搜索的單詞序列的單詞的詞類;解碼器,被配置為搜索與語音信號對應的候選單詞,使用已被搜索的候選單詞擴展之前已被搜索的單詞序列,并基于預測的詞類調整擴展的單詞序列的概率值。
本申請要求于2015年11月30日提交到韓國知識產權局的第10-2015-0168967號韓國專利申請的優先權,該申請的全部公開出于所有目的通過引用全部包含于此。
技術領域
下面的描述涉及一種語音識別設備和方法。
背景技術
與過去的現有技術不同,最近的語音識別技術已引起廣泛的關注。這是因為語音識別技術的實現允許互聯網信息、電子商務和在使用語音的各種普遍存在的環境中的操作的使用更加方便,并且甚至在用戶難以使用他們的雙手時也能滿足用戶的各種需要,諸如,啟用互聯網訪問、實施商業事務以及使用其他服務。
發明內容
提供發明內容從而以簡化的形式介紹構思的選擇,其將在下面的具體實施方式中將被進一步描述。發明內容不意在確定所要求保護主題的關鍵特征或必要特征,也不意在用作輔助確定所要求保護的主題的范圍。
在一個總體方面中,一種語音識別設備,包括:預測器,被配置為基于之前已被搜索的單詞序列預測跟隨之前已被搜索的單詞序列的單詞的詞類;解碼器,被配置為搜索與語音信號對應的候選單詞,使用已被搜索的候選單詞擴展之前已被搜索的單詞序列,并基于預測的詞類調整擴展的單詞序列的概率值。
詞類可為實體名或詞性;實體名可為人名、位置名、組織名、日期、時間、書名、電影名、音樂名或TV節目名。
預測器還可被配置為:使用詞類預測模型預測跟隨之前已被搜索的單詞序列的單詞的詞類。
詞類預測模型可基于詞典和語法以規則集的形式被構造,或者可使用命名的實體識別方案和詞性標注方案的任何一個或兩者通過機器學習被構造。
詞類預測模型可為基于遞歸神經網絡(RNN)的模型。
解碼器還可被配置為:使用以加權有限狀態轉換器(WFST)的形式在數據結構中構造的發音詞典和語言模型來搜索候選單詞。
解碼器還可被配置為:從未來的搜索目標排除已被搜索的候選單詞之中的不屬于預測的詞類的候選單詞。
解碼器還可被配置為:在已被搜索的候選單詞之中增加屬于預測的詞類的候選單詞的概率值。
解碼器還可被配置為:在已被搜索的候選單詞之中增加屬于預測的詞類的并包括在個性化的語言模型中的候選單詞的概率值。
預測器還可被配置為:預測跟隨之前已被搜索的單詞序列的單詞的詞類概率分布;解碼器還可被配置為:通過用每一候選單詞的概率值乘以該候選單詞所從屬的詞類的預測的概率值,調整每一候選單詞的概率值。
在另一總體方面中,一種語音識別方法,包括:基于之前已被搜索的單詞序列預測跟隨已被之前搜索的單詞序列的單詞的詞類;搜索與語音信號對應的候選單詞;使用已被搜索的候選單詞擴展之前已被搜索的單詞序列;基于預測的詞類調整擴展的單詞序列的概率值。
詞類可為實體名或詞性;實體名可為人名、位置名、組織名、日期、時間、書名、電影名、音樂名或TV節目名。
所述預測詞類的步驟可包括:使用詞類預測模型預測跟隨之前已被搜索的單詞序列的單詞的詞類。
詞類預測模型可基于詞典和語法以規則集的形式被構造,或者可使用命名的實體識別方案和詞性標注方案的任何一個或兩者通過機器學習被構造。
詞類預測模型可為基于遞歸神經網絡(RNN)的模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于三星電子株式會社,未經三星電子株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611078946.5/2.html,轉載請聲明來源鉆瓜專利網。





