[發明專利]語音識別設備和方法有效
| 申請號: | 201611078946.5 | 申請日: | 2016-11-30 |
| 公開(公告)號: | CN106816148B | 公開(公告)日: | 2022-04-22 |
| 發明(設計)人: | 李知炫 | 申請(專利權)人: | 三星電子株式會社 |
| 主分類號: | G10L15/197 | 分類號: | G10L15/197;G10L15/193;G10L15/16;G10L15/26 |
| 代理公司: | 北京銘碩知識產權代理有限公司 11286 | 代理人: | 張川緒;胡江海 |
| 地址: | 韓國京畿*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 設備 方法 | ||
1.一種語音識別設備,包括:
預測器,被配置為基于之前已被搜索的單詞序列預測跟隨所述之前已被搜索的單詞序列的單詞的詞類概率分布;
解碼器,被配置為搜索與語音信號和跟隨所述之前已被搜索的單詞序列的單詞對應的候選單詞,并使用已被搜索的候選單詞擴展所述之前已被搜索的單詞序列,
其中,使用已被搜索的候選單詞擴展所述之前已被搜索的單詞序列的處理包括:
計算與跟隨所述之前已被搜索的單詞序列的單詞對應的候選單詞的概率值;
通過預測的詞類概率分布和個性化的語言模型,調整候選單詞的概率值;
輸出擴展單詞序列,擴展單詞序列包括所述之前已被搜索的單詞序列和具有調整的概率值之中的最高的調整的概率值的候選單詞。
2.如權利要求1所述的語音識別設備,其中,詞類為實體名或詞性;
實體名為人名、位置名、組織名、日期、時間、書名、電影名、音樂名或TV節目名。
3.如權利要求1所述的語音識別設備,其中,預測器還被配置為:基于所述之前已被搜索的單詞序列預測跟隨所述之前已被搜索的單詞序列的單詞的詞類,
解碼器還被配置為:基于預測的詞類調整擴展的單詞序列的概率值。
4.如權利要求3所述的語音識別設備,其中,詞類預測模型基于詞典和語法以規則集的形式被構造,或者使用命名的實體識別方案和詞性標注方案中的任何一個或兩者通過機器學習被構造。
5.如權利要求3所述的語音識別設備,其中,詞類預測模型為基于遞歸神經網絡RNN的模型。
6.如權利要求1所述的語音識別設備,其中,解碼器還被配置為:使用以加權有限狀態轉換器WFST的形式在數據結構中構造的發音詞典和語言模型來搜索候選單詞。
7.如權利要求3所述的語音識別設備,其中,解碼器還被配置為:從未來的搜索目標排除已被搜索的候選單詞之中的不屬于預測的詞類的候選單詞。
8.如權利要求3所述的語音識別設備,其中,解碼器還被配置為:在已被搜索的候選單詞之中增加屬于預測的詞類的候選單詞的概率值。
9.如權利要求3所述的語音識別設備,其中,解碼器還被配置為:在已被搜索的候選單詞之中增加屬于預測的詞類的并包括在個性化的語言模型中的候選單詞的概率值。
10.如權利要求3所述的語音識別設備,其中,預測器還被配置為:使用詞類預測模型預測跟隨所述之前已被搜索的單詞序列的單詞的詞類;解碼器還被配置為:通過用每一候選單詞的概率值乘以該候選單詞所屬的詞類的預測的概率值,調整每一候選單詞的概率值。
11.一種語音識別方法,包括:
基于之前已被搜索的單詞序列預測跟隨所述之前已被搜索的單詞序列的單詞的詞類概率分布;
搜索與語音信號和跟隨所述之前已被搜索的單詞序列的單詞對應的候選單詞;
使用已被搜索的候選單詞擴展所述之前已被搜索的單詞序列,
其中,使用已被搜索的候選單詞擴展所述之前已被搜索的單詞序列的步驟包括:
計算與跟隨所述之前已被搜索的單詞序列的單詞對應的候選單詞的概率值;
通過預測的詞類概率分布和個性化的語言模型,調整候選單詞的概率值;
輸出擴展單詞序列,擴展單詞序列包括所述之前已被搜索的單詞序列和具有調整的概率值之中的最高的調整的概率值的候選單詞。
12.如權利要求11所述的語音識別方法,其中,詞類為實體名或詞性;
實體名為人名、位置名、組織名、日期、時間、書名、電影名、音樂名或TV節目名。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于三星電子株式會社,未經三星電子株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611078946.5/1.html,轉載請聲明來源鉆瓜專利網。





