[發明專利]語音識別方法及設備在審

申請號：	202010064349.7	申請日：	2020-01-20
公開（公告）號：	CN112331206A	公開（公告）日：	2021-02-05
發明（設計）人：	李知炫	申請（專利權）人：	三星電子株式會社
主分類號：	G10L15/26	分類號：	G10L15/26;G10L15/06;G10L15/08;G06F40/242;G06F40/154;G06F40/157;G06F40/117
代理公司：	北京銘碩知識產權代理有限公司 11286	代理人：	劉燦強;張川緒
地址：	韓國京畿***	國省代碼：	暫無信息
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	語音識別方法設備
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種語音識別方法，包括：

接收語音數據；

使用語音識別模型，從接收的語音數據獲得候選文本，候選文本包括至少一個詞和與包括在接收的語音數據中的目標詞的發音相關聯的語音符號序列；

用與語音符號序列對應的替換詞來替換包括在候選文本中的語音符號序列；和

基于替換的結果來確定與接收的語音數據對應的目標文本。

2.根據權利要求1所述的語音識別方法，其中，所述至少一個詞包括至少一個子詞，并且

候選文本包括所述至少一個子詞、語音符號序列、以及指示語音符號序列的開始和結束的標識符對。

3.根據權利要求2所述的語音識別方法，其中，替換的步驟包括：

用替換詞來替換由標識符對標識的語音符號序列。

4.根據權利要求2所述的語音識別方法，其中，標識符對指示與語音符號序列相關聯的目標詞的類別。

5.根據權利要求1所述的語音識別方法，還包括：

使用包括與多個詞和分別對應于所述多個詞的語音符號序列有關的信息的詞典數據，來確定與語音符號序列對應的替換詞。

6.根據權利要求5所述的語音識別方法，還包括：

計算包括在候選文本中的語音符號序列與包括在詞典數據中的語音符號序列中的每個之間的相似度；和

將與具有計算的包括在詞典數據中的語音符號序列的相似度之中的最大相似度的語音符號序列對應的詞確定為與包括在候選文本中的語音符號序列對應的替換詞。

7.根據權利要求5所述的語音識別方法，其中，詞典數據具有字典樹或哈希圖數據結構，并且

確定的步驟包括：

使用所述數據結構，從包括在詞典數據中的語音符號序列檢索與包括在候選文本中的語音符號序列對應的語音符號序列；和

將與檢索的語音符號序列對應的詞確定為與包括在候選文本中的語音符號序對應的替換詞。

8.根據權利要求4所述的語音識別方法，還包括：

使用與不同類別對應的詞典數據的集合之中的與由標識符對指示的類別對應的詞典數據，確定與包括在候選文本中的語音符號序列對應的替換詞；和

用確定的替換詞來替換包括在候選文本中的語音符號序列，

其中，與不同類別對應的詞典數據的集合包括與每個類別中的每個詞所對應的語音符號序列有關的信息。

9.根據權利要求1所述的語音識別方法，還包括：

響應于語音符號序列對應于多個詞，通過用所述多個詞中的每個替換語音符號序列來獲得多個候選目標文本；

使用語言模型來計算所述多個候選目標文本中的每個的分數；和

將具有計算的候選目標文本的分數之中的最大分數的候選目標文本確定為目標文本。

10.根據權利要求1所述的語音識別方法，其中，語音符號序列與對應于專有名詞的目標詞的發音相關聯。

11.根據權利要求1所述的語音識別方法，其中，語音識別模型包括：

編碼器，被配置為從接收的語音數據提取向量值；和

解碼器，被配置為基于向量值來輸出與接收的語音數據對應的候選文本。

12.一種存儲指令的非暫時性計算機可讀存儲介質，所述指令在被處理器執行時，使得所述處理器執行權利要求1的語音識別方法。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于三星電子株式會社，未經三星電子株式會社許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202010064349.7/1.html，轉載請聲明來源鉆瓜專利網。

上一篇：二次電池、電池模塊以及使用電池作為電源的裝置
下一篇：等離子體處理裝置及等離子體處理方法

同類專利

專利分類

G 物理

G10 樂器；聲學
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L15-00 語音識別
G10L15-02 .語音識別的特征提取；識別單位的選擇
G10L15-04 .分段或字極限檢測
G10L15-06 .創建基準模板；訓練語音識別系統，例如對說話者聲音特征的適應
G10L15-08 .語音分類或檢索
G10L15-20 .專門適用于不利環境

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】