[發明專利]語音識別方法及設備在審
| 申請號: | 202010064349.7 | 申請日: | 2020-01-20 |
| 公開(公告)號: | CN112331206A | 公開(公告)日: | 2021-02-05 |
| 發明(設計)人: | 李知炫 | 申請(專利權)人: | 三星電子株式會社 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G10L15/06;G10L15/08;G06F40/242;G06F40/154;G06F40/157;G06F40/117 |
| 代理公司: | 北京銘碩知識產權代理有限公司 11286 | 代理人: | 劉燦強;張川緒 |
| 地址: | 韓國京畿*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 方法 設備 | ||
提供了一種語音識別方法及設備。所述語音識別方法包括:接收語音數據;使用語音識別模型,從接收的語音數據獲得候選文本,候選文本包括至少一個詞和與包括在接收的語音數據中的目標詞的發音相關聯的語音符號序列;用與語音符號序列對應的替換詞來替換候選文本中包括的語音符號序列;和基于替換的結果來確定與接收的語音數據對應的目標文本。
本申請要求于2019年8月5日在韓國知識產權局提交的第10-2019-0094950號韓國專利申請的權益,所述韓國專利申請的全部公開出于所有目的通過引用包含于此。
技術領域
下面的描述涉及一種語音識別方法及設備。
背景技術
語音識別指的是計算機分析人類為了表達而說出的語音并將語音轉換為文本數據的技術。通過來自追求便利性的用戶的增長的需求,該技術正在迅速發展。使用神經網絡執行語音識別的方法正在被研究。神經網絡可以是通過數學的表示形式來模擬人類的生物神經元的特性并且使用模擬人類的學習能力的算法的模型。神經網絡可具有基于學習或訓練的結果針對尚未用于學習或訓練的輸入模式生成相對正確的輸出的泛化能力。因此,由于這樣的泛化能力,它被廣泛用于語音識別的技術領域。
發明內容
提供本發明內容來以簡化的形式介紹在以下具體實施方式中進一步描述的構思的選擇。本發明內容不意在標識要求權利的主題的關鍵特征或必要特征,也不意在用于幫助確定要求權利的主題的范圍。
在一個總體方面,一種語音識別方法包括:接收語音數據;使用語音識別模型,從接收的語音數據獲得候選文本,候選文本包括至少一個詞和與包括在接收的語音數據中的目標詞的發音相關聯的語音符號序列;用與語音符號序列對應的替換詞來替換包括在候選文本中的語音符號序列;和基于替換的結果來確定與接收的語音數據對應的目標文本。
所述至少一個詞可包括至少一個子詞,并且候選文本可包括所述至少一個子詞、語音符號序列、以及指示語音符號序列的開始和結束的標識符對。
替換的步驟可包括:用替換詞來替換由標識符對標識的語音符號序列。
標識符對可指示與語音符號序列相關聯的目標詞的類別。
所述方法可包括:使用包括與多個詞和分別對應于所述多個詞的語音符號序列有關的信息的詞典數據,來確定與語音符號序列對應的替換詞。
所述方法可包括:計算包括在候選文本中的語音符號序列與包括在詞典數據中的語音符號序列中的每個之間的相似度;和將與具有計算的包括在詞典數據中的語音符號序列的相似度之中的最大相似度的語音符號序列對應的詞確定為與包括在候選文本中的語音符號序列對應的替換詞。
詞典數據可具有字典樹或哈希圖數據結構,并且確定的步驟可包括:使用所述數據結構,從包括在詞典數據中的語音符號序列檢索與包括在候選文本中的語音符號序列對應的語音符號序列;和將與檢索的語音符號序列對應的詞確定為與候選文本中的語音符號序對應的替換詞。
所述方法可包括:使用與不同類別對應的詞典數據的集合之中的與由標識符對指示的類別對應的詞典數據,確定與包括在候選文本中的語音符號序列對應的替換詞;和用確定的替換詞來替換包括在候選文本中的語音符號序列。與不同類別對應的詞典數據的集合中的每個可包括與每個類別中的每個詞所對應的語音符號序列有關的信息。
響應于語音符號序列對應于多個詞,所述方法可包括:通過用所述多個詞中的每個替換語音符號序列來獲得多個候選目標文本;使用語言模型來計算所述多個候選目標文本中的每個的分數;和將具有計算的候選目標文本的分數之中的最大分數的候選目標文本確定為目標文本。
語音符號序列可與對應于專有名詞的目標詞的發音相關聯。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于三星電子株式會社,未經三星電子株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010064349.7/2.html,轉載請聲明來源鉆瓜專利網。





