[發明專利]語音識別處理方法、裝置、電子設備及存儲介質在審

申請號：	202011084688.8	申請日：	2020-10-12
公開（公告）號：	CN113409791A	公開（公告）日：	2021-09-17
發明（設計）人：	陳鄭敏	申請（專利權）人：	騰訊科技（深圳）有限公司
主分類號：	G10L15/26	分類號：	G10L15/26;G10L15/183;G10L15/02
代理公司：	北京派特恩知識產權代理有限公司 11270	代理人：	崔曉嵐;張穎玲
地址：	518057 廣東省深圳***	國省代碼：	廣東;44
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	語音識別處理方法裝置電子設備存儲介質
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本申請提供了一種語音識別處理方法、裝置、電子設備及計算機可讀存儲介質；涉及語音技術中的自動語音識別；方法包括：對多媒體文件中的語音進行語音識別，以得到包括多個詞語的語句，其中，所述多個詞語用于作為初始識別結果；根據與每個所述詞語的識別確定程度對應的顯示方式，顯示包括所述多個詞語的所述語句；顯示至少一個所述詞語的候選詞語；響應于選擇操作，根據被選中的候選詞語替換所述語句中與所述被選中的候選詞語處于相同位置的詞語。通過本申請，能夠在語音識別過程中提高獲得符合用戶需求的識別結果的效率。

技術領域

本申請涉及人工智能技術，尤其涉及一種語音識別處理方法、裝置、電子設備及計算機可讀存儲介質。

背景技術

人工智能(AI，Artificial Intelligence)是利用數字計算機或者數字計算機控制的機器模擬、延伸和擴展人的智能，感知環境、獲取知識并使用知識獲得最佳結果的理論、方法和技術及應用系統。語音技術(Speech Technology)是人工智能中的一個重要方向，主要研究能實現人與計算機之間用自然語言進行有效通信的各種理論和方法。

自動語音識別(ASR，Automatic Speech Recognition)是語音技術的一個分支，能夠將人的語音轉換為文本。但是，在相關技術中自動語音識別并不能完全識別連續發音等問題，因此容易出現語音識別錯誤。當針對語音信息識別出的初始識別結果有錯誤時，往往需要用戶通過手動輸入正確文本的方式去修改初始識別結果，如此，將會導致在語音識別過程中獲取符合用戶需求的識別結果的效率較低以及速度較慢，相關技術尚無有效解決方案。

發明內容

本申請實施例提供一種語音識別處理方法、裝置、電子設備及計算機可讀存儲介質，能夠在語音識別過程中提高獲得符合用戶需求的識別結果的效率。

本申請實施例的技術方案是這樣實現的：

本申請實施例提供一種語音識別處理方法，包括：

對多媒體文件中的語音進行語音識別，以得到包括多個詞語的語句，其中，所述多個詞語用于作為初始識別結果；

根據與每個所述詞語的識別確定程度對應的顯示方式，顯示包括所述多個詞語的所述語句；

顯示至少一個所述詞語的候選詞語；

響應于選擇操作，根據被選中的候選詞語替換所述語句中與所述被選中的候選詞語處于相同位置的詞語。

在上述方案中，所述對多媒體文件中的語音進行語音識別，以得到包括多個詞語的語句，包括：

對所述多媒體文件中的語音進行語音識別，得到多個解碼路徑、以及對應每個所述解碼路徑的路徑評分；

其中，每個所述解碼路徑包括多個詞語。

在上述方案中，所述對所述多媒體文件中的語音進行語音識別，得到多個解碼路徑、以及對應每個所述解碼路徑的路徑評分，包括：