[發明專利]表述內容識別方法、裝置、電子設備、機器可讀存儲介質有效
| 申請號: | 201811415009.3 | 申請日: | 2018-11-26 |
| 公開(公告)號: | CN109583359B | 公開(公告)日: | 2023-10-24 |
| 發明(設計)人: | 馮瑞豐;雷艷兵 | 申請(專利權)人: | 北京小米移動軟件有限公司 |
| 主分類號: | G06V10/80 | 分類號: | G06V10/80;G06V40/20;G06V10/75;G06V30/26 |
| 代理公司: | 北京博思佳知識產權代理有限公司 11415 | 代理人: | 林祥 |
| 地址: | 100085 北京市海淀區清河*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 表述 內容 識別 方法 裝置 電子設備 機器 可讀 存儲 介質 | ||
本公開是關于一種表述內容識別方法、裝置、電子設備、機器可讀存儲介質。一種表述內容識別方法,包括:在用戶表述過程中,對所述用戶語音以及表述部位圖像進行采集;對采集的語音數據以及圖像數據分別進行識別;基于所述語音數據的識別結果和所述圖像數據的識別結果,確定用戶表述的內容。可見,本實施例中利用語音數據和圖像數據確定出用戶表述的內容,克服嘈雜環境對語音識別結果的影響,有利于提高識別結果的準確度,提升用戶的使用體驗。
技術領域
本公開涉及控制技術領域,尤其涉及一種表述內容識別方法、裝置、電子設備、機器可讀存儲介質。
背景技術
目前,語音識別技術得到的迅速發展,開始應用于工業、家電、通信、汽車電子、醫療、家庭服務、消費電子產品等各個領域。現有的語音設備上設置有麥克風陣列,通過麥克風陣列進行拾音,然后語音設備中處理器對語音數據進行降噪、語音識別以及自然語音處理,從而得到用戶表述的內容。
然而,當語音設備放置在嘈雜環境下或者用戶有發音障礙時,語音設備識別用戶表述內容的準確率大大降低,甚至無法有效識別出用戶的表述內容。
發明內容
本公開提供一種表述內容識別方法、裝置、電子設備、機器可讀存儲介質,以解決相關技術的不足。
根據本公開實施例的第一方面,提供一種表述內容識別方法,包括:
在用戶表述過程中,對所述用戶語音以及表述部位圖像進行采集;
對采集的語音數據以及圖像數據分別進行識別;
基于所述語音數據的識別結果和所述圖像數據的識別結果,確定用戶表述的內容。
可選地,所述表述部位包括:口部;對采集的圖像數據進行識別,包括:
對采集的圖像中口部進行識別定位;
采用第一預設算法對采集圖像中的口型變化進行唇語分析,得到識別的文字;或者,將采集圖像中的口型與預設口型數據庫中的口型數據進行匹配,得到識別的文字。
可選地,所述表述部位包括:手部;對采集的圖像數據進行識別,包括:
對采集的圖像中手部進行識別定位;
采用第二預設算法對采集圖像中的手勢變化進行手語分析,得到識別的文字;或者,將采集圖像中的手勢與預設手勢動作數據庫中的手勢數據進行匹配,得到識別的文字。
可選地,所述表述部位包括:口部和手部;對采集的圖像數據進行識別,包括:
對采集的圖像中口部和手部分別進行識別定位;
采用第一預設算法對采集圖像中的口型變化進行唇語分析,或者,將采集圖像中的口型與預設口型數據庫中的口型數據進行匹配,得到基于口部圖像數據識別的第一文字;
采用第二預設算法對采集圖像中的手勢變化進行手語分析,或者,將采集圖像中的手勢與預設手勢動作數據庫中的手勢數據進行匹配,得到基于手部圖像數據識別的第二文字;
根據所述第一文字的識別準確率和所述第二文字的識別準確率,對所述第一文字和所述第二文字進行合成處理,得到識別的文字。
可選地,基于所述語音數據的識別結果和所述圖像數據的識別結果,確定用戶表述的內容,包括:
分別獲取所述語音數據的識別結果和所述圖像數據的識別結果的識別準確率;
將識別準確率較高的識別結果確定為識別出的表述內容。
可選地,基于所述語音數據的識別結果和所述圖像數據的識別結果,確定用戶表述的內容,包括:
定位基準識別結果中的文字缺失區域;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京小米移動軟件有限公司,未經北京小米移動軟件有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811415009.3/2.html,轉載請聲明來源鉆瓜專利網。
- 內容再現系統、內容提供方法、內容再現裝置、內容提供裝置、內容再現程序和內容提供程序
- 內容記錄系統、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統、內容服務器、內容終端及內容服務方法
- 內容分發系統、內容分發裝置、內容再生終端及內容分發方法
- 內容發布、內容獲取的方法、內容發布裝置及內容傳播系統
- 內容提供裝置、內容提供方法、內容再現裝置、內容再現方法
- 內容傳輸設備、內容傳輸方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容發送設備、內容發送方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容再現裝置、內容再現方法、內容再現程序及內容提供系統
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法





