[發(fā)明專利]人機(jī)語(yǔ)音交互方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202110737501.8 | 申請(qǐng)日: | 2021-06-30 |
| 公開(公告)號(hào): | CN113539261A | 公開(公告)日: | 2021-10-22 |
| 發(fā)明(設(shè)計(jì))人: | 杜京鋼;張文瑜 | 申請(qǐng)(專利權(quán))人: | 大眾問(wèn)問(wèn)(北京)信息科技有限公司 |
| 主分類號(hào): | G10L15/22 | 分類號(hào): | G10L15/22;G10L15/26;G10L15/18;G10L25/63;G10L25/27 |
| 代理公司: | 北京市萬(wàn)慧達(dá)律師事務(wù)所 11111 | 代理人: | 劉艷麗 |
| 地址: | 100098 北京市海淀*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 人機(jī) 語(yǔ)音 交互 方法 裝置 計(jì)算機(jī) 設(shè)備 存儲(chǔ) 介質(zhì) | ||
1.一種人機(jī)語(yǔ)音交互方法,所述方法包括:
接收來(lái)自用戶的對(duì)話語(yǔ)音;
識(shí)別出所述對(duì)話語(yǔ)音對(duì)應(yīng)的語(yǔ)音文本,對(duì)所述語(yǔ)音文本進(jìn)行語(yǔ)義分析,并基于語(yǔ)義分析的結(jié)果識(shí)別出所述用戶的交互需求類型;
在所述交互需求類型為任務(wù)相關(guān)型時(shí),通過(guò)任務(wù)樹模型確定出用于應(yīng)答所述語(yǔ)音文本的回復(fù)文本;
在所述交互需求類型為任務(wù)無(wú)關(guān)型時(shí),通過(guò)概率模型確定出用于應(yīng)答所述語(yǔ)音文本的回復(fù)文本;
根據(jù)確定出的回復(fù)文本進(jìn)行語(yǔ)音應(yīng)答。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
對(duì)所述對(duì)話語(yǔ)音進(jìn)行聲紋識(shí)別,并基于聲紋識(shí)別的結(jié)果確定出所述用戶的屬性信息,所述屬性信息為年齡區(qū)間和/或性別;
所述根據(jù)確定出的回復(fù)文本進(jìn)行語(yǔ)音應(yīng)答,包括:
確定所述用戶的屬性信息對(duì)應(yīng)的播報(bào)音質(zhì)類型;
根據(jù)所述播報(bào)音質(zhì)類型和確定出的回復(fù)文本生成應(yīng)答語(yǔ)音,播放所述應(yīng)答語(yǔ)音。
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述通過(guò)概率模型確定出用于應(yīng)答所述語(yǔ)音文本的回復(fù)文本,包括:
獲取預(yù)設(shè)語(yǔ)料庫(kù)中的多條語(yǔ)料文本,所述多條語(yǔ)料文本為所述預(yù)設(shè)語(yǔ)料庫(kù)中的全部或部分語(yǔ)料文本;
通過(guò)概率模型計(jì)算出每條所述語(yǔ)料文本對(duì)應(yīng)的回復(fù)概率;
將對(duì)應(yīng)的回復(fù)概率最高的語(yǔ)料文本作為用于應(yīng)答所述語(yǔ)音文本的回復(fù)文本。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述概率模型為貝葉斯網(wǎng)絡(luò)概率模型,通過(guò)概率模型計(jì)算出任一條所述語(yǔ)料文本對(duì)應(yīng)的回復(fù)概率的步驟,包括:
識(shí)別出所述用戶在說(shuō)出所述對(duì)話語(yǔ)音時(shí)的情緒類型,通過(guò)第一先驗(yàn)概率映射關(guān)系確定出與所述情緒類型對(duì)應(yīng)的先驗(yàn)概率,并將其作為貝葉斯網(wǎng)絡(luò)概率模型的第一概率;
判斷該任一條語(yǔ)料文本是否包含高頻詞匯,通過(guò)第二先驗(yàn)概率映射關(guān)系確定出與判斷結(jié)果對(duì)應(yīng)的先驗(yàn)概率,并將其作為貝葉斯網(wǎng)絡(luò)概率模型的第二概率;
識(shí)別出該任一條語(yǔ)料文本所屬的話題類型,判斷所述話題類型是否屬于偏好話題,通過(guò)第三先驗(yàn)概率映射關(guān)系確定出與判斷結(jié)果對(duì)應(yīng)的先驗(yàn)概率,并將其作為貝葉斯網(wǎng)絡(luò)概率模型的第三概率;
獲取該任一條語(yǔ)料文本對(duì)應(yīng)的語(yǔ)料風(fēng)格類型,通過(guò)第四先驗(yàn)概率映射關(guān)系確定出與所述語(yǔ)料風(fēng)格類型和所述情緒類型對(duì)應(yīng)的先驗(yàn)概率,并將其作為貝葉斯網(wǎng)絡(luò)概率模型的第四概率;
根據(jù)所述第一概率、所述第二概率、所述第三概率和所述第四概率中的至少兩項(xiàng)概率計(jì)算出該任一條所述語(yǔ)料文本對(duì)應(yīng)的回復(fù)概率。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述識(shí)別出所述用戶在說(shuō)出所述對(duì)話語(yǔ)音時(shí)的情緒類型,包括:
獲取攝像頭采集到的所述用戶在說(shuō)出所述對(duì)話語(yǔ)音時(shí)的表情圖像,對(duì)所述表情圖像進(jìn)行情緒識(shí)別,根據(jù)情緒識(shí)別的結(jié)果確定出所述用戶在說(shuō)出所述對(duì)話語(yǔ)音時(shí)的情緒類型;
和/或,對(duì)所述對(duì)話語(yǔ)音進(jìn)行情緒識(shí)別,根據(jù)情緒識(shí)別的結(jié)果確定出所述用戶在說(shuō)出所述對(duì)話語(yǔ)音時(shí)的情緒類型。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,在所述通過(guò)第四先驗(yàn)概率映射關(guān)系確定出與所述語(yǔ)料風(fēng)格類型和所述情緒類型對(duì)應(yīng)的先驗(yàn)概率之前,所述方法還包括:
獲取與所述用戶在本次會(huì)話中的交互對(duì)話次數(shù);
根據(jù)所述交互對(duì)話次數(shù)和所述情緒類型判斷是否需要對(duì)當(dāng)前的第四先驗(yàn)概率映射關(guān)系進(jìn)行概率值更新;
在確定需要更新時(shí),對(duì)當(dāng)前的第四先驗(yàn)概率映射關(guān)系進(jìn)行概率值更新。
7.根據(jù)權(quán)利要求5所述的方法,其特征在于,在判斷所述話題類型是否屬于偏好話題之前,所述方法還包括:根據(jù)所述交互對(duì)話次數(shù)和所述情緒類型判斷是否需要對(duì)當(dāng)前的偏好話題進(jìn)行更新;在確定需要更新時(shí),對(duì)當(dāng)前的偏好話題進(jìn)行更新。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于大眾問(wèn)問(wèn)(北京)信息科技有限公司,未經(jīng)大眾問(wèn)問(wèn)(北京)信息科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110737501.8/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 一種人機(jī)命令隊(duì)列管理系統(tǒng)和方法
- 無(wú)人機(jī)監(jiān)控方法、系統(tǒng)以及無(wú)人機(jī)和地面站
- 無(wú)人機(jī)拍攝方法及裝置、無(wú)人機(jī)和地面控制裝置
- 一種確定無(wú)人機(jī)飛行路徑的方法及裝置
- 一種執(zhí)行任務(wù)時(shí)無(wú)人機(jī)群數(shù)據(jù)鏈真實(shí)性檢測(cè)方法
- 連發(fā)無(wú)人機(jī)電磁彈射系統(tǒng)及無(wú)人機(jī)機(jī)庫(kù)
- 用于無(wú)人機(jī)超視距管控的系統(tǒng)及其工作方法
- 一種有人機(jī)與無(wú)人機(jī)的組合系統(tǒng)
- 連發(fā)無(wú)人機(jī)電磁彈射系統(tǒng)及無(wú)人機(jī)機(jī)庫(kù)
- 無(wú)人機(jī)的控制方法、裝置、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)及無(wú)人機(jī)
- 用于語(yǔ)音處理的方法與系統(tǒng)
- 一種語(yǔ)音識(shí)別測(cè)試系統(tǒng)及方法
- 用于語(yǔ)音識(shí)別的方法和裝置
- 一種語(yǔ)音消毒柜的控制方法及語(yǔ)音消毒柜
- 一種語(yǔ)音處理方法及裝置
- 混合語(yǔ)音識(shí)別方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 語(yǔ)音情緒識(shí)別方法、系統(tǒng)、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 一種具有語(yǔ)音識(shí)別功能的智能語(yǔ)音終端設(shè)備
- 語(yǔ)音增強(qiáng)方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種聲紋鑒定語(yǔ)音重組方法和系統(tǒng)
- 一種數(shù)據(jù)庫(kù)讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





