[發明專利]一種語音識別結果的處理方法、裝置及電子設備有效

申請號：	202010076388.9	申請日：	2020-01-23
公開（公告）號：	CN111292745B	公開（公告）日：	2023-03-24
發明（設計）人：	蘇少煒;陳孝良;馮大航;常樂	申請（專利權）人：	北京聲智科技有限公司
主分類號：	G10L15/22	分類號：	G10L15/22;G10L15/26;G10L15/20;G10L15/10;G10L15/18
代理公司：	北京集佳知識產權代理有限公司 11227	代理人：	趙煥
地址：	100080 北京市***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種語音識別結果處理方法裝置電子設備
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本發明提供了一種語音識別結果的處理方法、裝置及電子設備，在用戶輸入語音信息，得到該語音信息對應的語音識別結果之后，根據目標終端的顯示頁面獲取場景信息以及獲取與所述場景信息對應的文本詞匯，將所述語音識別結果與所述文本詞匯進行文本相似度計算，得到目標文本詞匯，確定所述目標文本詞匯為目標語音識別結果。通過本發明，對語音識別結果進行了優化，引入了根據目標終端的顯示頁面獲取的場景信息，使其更加符合用戶的觀看場景，即更貼近用戶需求，進而提高了語音信息的解析準確率。

技術領域

本發明涉及語音識別領域，更具體的說，涉及一種語音識別結果的處理方法、裝置及電子設備。

背景技術

電視、機頂盒、平板電腦、智能冰箱等帶屏交互設備，因為設備及環境噪聲、說話者的口音、語調等等導致語音識別結果不準確，此時往往需要對屏幕上的文字菜單或節目名稱等等進行精確識別以便進行相關交互操作，例如播放屏幕上的電影時需要觸發屏幕上的按鍵操作等等。

因此，亟需解決由于語音交互真實場景下現有語音識別技術存在的識別準確率低等情形導致語義解析準確率低的問題。

發明內容

有鑒于此，本發明提供一種語音識別結果的處理方法、裝置及電子設備，以解決亟需解決由于語音交互真實場景下現有語音識別技術存在的識別準確率低等情形導致語義解析準確率低的問題。

為解決上述技術問題，本發明采用了如下技術方案：

一種語音識別結果的處理方法，包括：

獲取用戶輸入的語音信息的語音識別結果；

根據目標終端的顯示頁面獲取場景信息以及獲取與所述場景信息對應的文本詞匯；

將所述語音識別結果與所述文本詞匯進行文本相似度計算，得到目標文本詞匯，確定所述目標文本詞匯為目標語音識別結果。

可選地，獲取與所述場景信息對應的文本詞匯，包括：

獲取所述顯示頁面上顯示的第一文本內容；

獲取與所述場景信息相關但是未顯示在所述顯示頁面上的第二文本內容；

將所述第一文本內容和所述第二文本內容確定為所述文本詞匯。

可選地，將所述語音識別結果與所述文本詞匯進行文本相似度計算，得到目標文本詞匯，確定所述目標文本詞匯為目標語音識別結果，包括：

提取出所述語音識別結果中的實體詞，以及確定所述語音識別結果對應的用戶操作意圖；

將所述實體詞與所述第一文本內容做匹配；

若能夠匹配上，將所述實體詞與所述用戶操作意圖對應的詞語作為目標語音識別結果；

若不能匹配上，將所述實體詞與所述第二文本內容做匹配；

若能夠匹配上，將所述實體詞與所述用戶操作意圖對應的詞語作為目標語音識別結果。

可選地，將所述語音識別結果與所述文本詞匯進行文本相似度計算，得到目標文本詞匯，確定所述目標文本詞匯為目標語音識別結果，還包括：

若所述實體詞與所述第二文本內容不能匹配上，則將所述實體詞與所述文本詞匯做最長公共子序列LCS計算，得到LCS計算結果；

篩選出所述LCS計算結果中的最長公共子序列，確定出所述最長公共子序列對應的文本詞匯，并作為待分析文本詞匯；

將所述實體詞與所述待分析文本詞匯進行模糊匹配，得到模糊匹配結果；

篩選出所述模糊匹配結果中的最優結果；

將所述最優結果與所述用戶操作意圖對應的詞語作為目標語音識別結果。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于北京聲智科技有限公司，未經北京聲智科技有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202010076388.9/2.html，轉載請聲明來源鉆瓜專利網。

上一篇：基于圖像的文本識別方法、裝置及存儲介質
下一篇：一種快速適應協議變化的數據處理系統

同類專利

專利分類

G 物理

G10 樂器；聲學
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L15-00 語音識別
G10L15-02 .語音識別的特征提取；識別單位的選擇
G10L15-04 .分段或字極限檢測
G10L15-06 .創建基準模板；訓練語音識別系統，例如對說話者聲音特征的適應
G10L15-08 .語音分類或檢索
G10L15-20 .專門適用于不利環境

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】