[發明專利]一種基于語音檢測的語音交互方法及其裝置有效
| 申請號: | 202011342535.9 | 申請日: | 2020-11-25 |
| 公開(公告)號: | CN112562734B | 公開(公告)日: | 2021-08-27 |
| 發明(設計)人: | 繆純;韓瑞;吳鵬程 | 申請(專利權)人: | 中檢啟迪(北京)科技有限公司 |
| 主分類號: | G10L25/60 | 分類號: | G10L25/60;G10L25/63;G10L15/22 |
| 代理公司: | 北京力量專利代理事務所(特殊普通合伙) 11504 | 代理人: | 徐穎超 |
| 地址: | 101312 北京市順義區金航西*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 語音 檢測 交互 方法 及其 裝置 | ||
1.一種基于語音檢測的語音交互方法,其特征在于,包括:
獲取待檢測語音;其中所述待檢測語音包括多種類別的音頻內容;
根據不同音頻內容的特征信息,將所述待檢測語音拆分為多個不同類別的音頻內容;
獲取用戶的面部圖像,分析所述面部圖像得到所述用戶的多個屬性標簽;所述多個屬性標簽表征所述用戶的各個不同維度特征;
分別反饋所述多個不同類別的音頻內容給用戶;
獲取所述用戶的第一確認信息;所述第一確認信息用于確認所述多個不同類別的音頻內容中對應所述用戶的輸入信息的音頻內容;
識別所述第一確認信息對應的音頻內容,得到識別內容;
反饋所述識別內容給所述用戶;
獲取所述用戶的第二確認信息;所述第二確認信息用于確認所述識別內容是否為所述用戶的真實意思的表達;
當所述第二確認信息為所述用戶的真實意思的表達時,根據所述識別內容,確定交互信息;以及
當數據庫中不存在與所述識別內容相同或相似的交互信息時,將所述識別內容拆分為多個關鍵詞,并且根據所述多個關鍵詞在所述數據庫中查找相關的交互信息,并且將查找到的交互信息展示給用戶,由用戶主動選取;
其中,分別反饋所述多個不同類別的音頻內容給用戶的實現方式包括:
按照預設時長,將每個所述音頻內容拆分為時間小于或等于所述預設時長的音頻段;
根據所述用戶的多個屬性標簽,確定所述多個不同類別的音頻內容的反饋順序;以及
按照所述反饋順序分別反饋每個所述音頻內容的至少一個音頻段給用戶。
2.根據權利要求1所述的語音交互方法,其特征在于,所述特征信息包括音調、音色和音量;所述根據不同音頻內容的特征信息,將所述待檢測語音拆分為多個不同類別的音頻內容包括:
根據所述待檢測語音的音調、音色和音量,將所述待檢測語音拆分為多個音頻內容。
3.根據權利要求1所述的語音交互方法,其特征在于,所述屬性標簽包括如下維度特征中的任一種或多種的組合:地域、年齡、性別、興趣、情緒。
4.根據權利要求1所述的語音交互方法,其特征在于,所述根據所述用戶的多個屬性標簽,確定所述多個不同類別的音頻內容的反饋順序包括:
計算所述用戶的多個屬性標簽與所述不同類別的音頻內容的特征信息之間的相似度;以及
按照相似度由大至小的順序反饋所述多個不同類別的音頻內容。
5.根據權利要求4所述的語音交互方法,其特征在于,所述計算所述用戶的多個屬性標簽與所述不同類別的音頻內容的特征信息之間的相似度包括:
分別計算所述用戶的每個屬性標簽與所述音頻內容的對應的特性信息之間的單維度相似度;以及
對多個所述單維度相似度進行加權,得到所述用戶的多個屬性標簽與所述不同類別的音頻內容的特征信息之間的相似度。
6.一種基于語音檢測的語音交互裝置,其特征在于,包括:
獲取模塊,用于獲取待檢測語音;其中所述待檢測語音包括多種類別的音頻內容;
拆分模塊,用于根據不同音頻內容的特征信息,將所述待檢測語音拆分為多個不同類別的音頻內容;
屬性標簽獲取模塊,用于獲取用戶的面部圖像,分析所述面部圖像得到所述用戶的多個屬性標簽;所述多個屬性標簽表征所述用戶的各個不同維度特征;
第一反饋模塊,用于分別反饋所述多個不同類別的音頻內容給用戶;
第一確認模塊,用于獲取所述用戶的第一確認信息;所述第一確認信息用于確認所述多個不同類別的音頻內容中對應所述用戶的輸入信息的音頻內容;
識別模塊,用于識別所述第一確認信息對應的音頻內容,得到識別內容;
第二反饋模塊,用于反饋所述識別內容給所述用戶;
第二確認模塊,用于獲取所述用戶的第二確認信息;所述第二確認信息用于確認所述識別內容是否為所述用戶的真實意思的表達;以及
交互模塊,用于當所述第二確認信息為所述用戶的真實意思的表達時,根據所述識別內容,確定交互信息;且當數據庫中不存在與所述識別內容相同或相似的交互信息時,將所述識別內容拆分為多個關鍵詞,并且根據所述多個關鍵詞在所述數據庫中查找相關的交互信息,并且將查找到的交互信息展示給用戶,由用戶主動選取;
其中,所述第一反饋模塊進一步配置為:根據所述用戶的多個屬性標簽,確定所述多個不同類別的音頻內容的反饋順序;所述第一反饋模塊包括:拆分單元,用于按照預設時長,將每個所述音頻內容拆分為時間小于或等于所述預設時長的音頻段;分段反饋單元,用于按照所述反饋順序分別反饋每個所述音頻內容的至少一個音頻段給用戶。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中檢啟迪(北京)科技有限公司,未經中檢啟迪(北京)科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011342535.9/1.html,轉載請聲明來源鉆瓜專利網。





