[發明專利]語音識別方法及設備在審
| 申請號: | 202010064349.7 | 申請日: | 2020-01-20 |
| 公開(公告)號: | CN112331206A | 公開(公告)日: | 2021-02-05 |
| 發明(設計)人: | 李知炫 | 申請(專利權)人: | 三星電子株式會社 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G10L15/06;G10L15/08;G06F40/242;G06F40/154;G06F40/157;G06F40/117 |
| 代理公司: | 北京銘碩知識產權代理有限公司 11286 | 代理人: | 劉燦強;張川緒 |
| 地址: | 韓國京畿*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 方法 設備 | ||
1.一種語音識別方法,包括:
接收語音數據;
使用語音識別模型,從接收的語音數據獲得候選文本,候選文本包括至少一個詞和與包括在接收的語音數據中的目標詞的發音相關聯的語音符號序列;
用與語音符號序列對應的替換詞來替換包括在候選文本中的語音符號序列;和
基于替換的結果來確定與接收的語音數據對應的目標文本。
2.根據權利要求1所述的語音識別方法,其中,所述至少一個詞包括至少一個子詞,并且
候選文本包括所述至少一個子詞、語音符號序列、以及指示語音符號序列的開始和結束的標識符對。
3.根據權利要求2所述的語音識別方法,其中,替換的步驟包括:
用替換詞來替換由標識符對標識的語音符號序列。
4.根據權利要求2所述的語音識別方法,其中,標識符對指示與語音符號序列相關聯的目標詞的類別。
5.根據權利要求1所述的語音識別方法,還包括:
使用包括與多個詞和分別對應于所述多個詞的語音符號序列有關的信息的詞典數據,來確定與語音符號序列對應的替換詞。
6.根據權利要求5所述的語音識別方法,還包括:
計算包括在候選文本中的語音符號序列與包括在詞典數據中的語音符號序列中的每個之間的相似度;和
將與具有計算的包括在詞典數據中的語音符號序列的相似度之中的最大相似度的語音符號序列對應的詞確定為與包括在候選文本中的語音符號序列對應的替換詞。
7.根據權利要求5所述的語音識別方法,其中,詞典數據具有字典樹或哈希圖數據結構,并且
確定的步驟包括:
使用所述數據結構,從包括在詞典數據中的語音符號序列檢索與包括在候選文本中的語音符號序列對應的語音符號序列;和
將與檢索的語音符號序列對應的詞確定為與包括在候選文本中的語音符號序對應的替換詞。
8.根據權利要求4所述的語音識別方法,還包括:
使用與不同類別對應的詞典數據的集合之中的與由標識符對指示的類別對應的詞典數據,確定與包括在候選文本中的語音符號序列對應的替換詞;和
用確定的替換詞來替換包括在候選文本中的語音符號序列,
其中,與不同類別對應的詞典數據的集合包括與每個類別中的每個詞所對應的語音符號序列有關的信息。
9.根據權利要求1所述的語音識別方法,還包括:
響應于語音符號序列對應于多個詞,通過用所述多個詞中的每個替換語音符號序列來獲得多個候選目標文本;
使用語言模型來計算所述多個候選目標文本中的每個的分數;和
將具有計算的候選目標文本的分數之中的最大分數的候選目標文本確定為目標文本。
10.根據權利要求1所述的語音識別方法,其中,語音符號序列與對應于專有名詞的目標詞的發音相關聯。
11.根據權利要求1所述的語音識別方法,其中,語音識別模型包括:
編碼器,被配置為從接收的語音數據提取向量值;和
解碼器,被配置為基于向量值來輸出與接收的語音數據對應的候選文本。
12.一種存儲指令的非暫時性計算機可讀存儲介質,所述指令在被處理器執行時,使得所述處理器執行權利要求1的語音識別方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于三星電子株式會社,未經三星電子株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010064349.7/1.html,轉載請聲明來源鉆瓜專利網。





