[發(fā)明專利]進(jìn)行自動語音應(yīng)答處理的方法、裝置、設(shè)備及存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 202010114987.5 | 申請日: | 2020-02-25 |
| 公開(公告)號: | CN111327772B | 公開(公告)日: | 2021-09-17 |
| 發(fā)明(設(shè)計)人: | 原俊;郭潤增;黃家宇;吳志偉;張穎;耿志軍 | 申請(專利權(quán))人: | 廣州騰訊科技有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;H04M3/493;G10L15/24;G10L15/26;G10L17/22;G06F16/332;G06F16/335;G06F16/635;G06F16/64;G06F16/683;G06K9/00 |
| 代理公司: | 北京三高永信知識產(chǎn)權(quán)代理有限責(zé)任公司 11138 | 代理人: | 祝亞男 |
| 地址: | 510310 廣東省廣*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 進(jìn)行 自動 語音 應(yīng)答 處理 方法 裝置 設(shè)備 存儲 介質(zhì) | ||
1.一種進(jìn)行自動語音應(yīng)答處理的方法,其特征在于,所述方法包括:
獲取用戶的圖像數(shù)據(jù);
基于所述圖像數(shù)據(jù)和預(yù)先訓(xùn)練的用戶屬性狀態(tài)分析模型,確定所述用戶的屬性狀態(tài)信息;
對所述用戶的圖像數(shù)據(jù)進(jìn)行人臉識別,基于所述用戶的圖像數(shù)據(jù),確定所述用戶的賬戶,獲取所述賬戶的歷史操作信息,其中,所述歷史操作信息中包括消費(fèi)信息、感興趣商品;
基于所述屬性狀態(tài)信息、所述歷史操作信息和預(yù)先訓(xùn)練的交互風(fēng)格分析模型,確定對所述用戶進(jìn)行自動語音應(yīng)答的目標(biāo)交互風(fēng)格信息;
基于所述目標(biāo)交互風(fēng)格信息,進(jìn)行自動語音應(yīng)答處理。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述目標(biāo)交互風(fēng)格信息包括目標(biāo)語音風(fēng)格信息;
所述基于所述目標(biāo)語音風(fēng)格信息,進(jìn)行自動語音應(yīng)答處理,包括:
獲取用戶語音音頻;
對所述用戶音頻進(jìn)行識別,生成對應(yīng)的文字;
基于所述文字,以及預(yù)先訓(xùn)練的對話模型,確定目標(biāo)交互文字;
基于語音合成算法,與所述目標(biāo)語音風(fēng)格信息對應(yīng)的調(diào)節(jié)參數(shù),將目標(biāo)交互文字轉(zhuǎn)化成與所述目標(biāo)語音風(fēng)格信息對應(yīng)的目標(biāo)應(yīng)答語音音頻;
播放所述目標(biāo)應(yīng)答語音音頻。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述目標(biāo)交互風(fēng)格信息還包括目標(biāo)背景音樂風(fēng)格信息;
所述方法還包括:
播放所述目標(biāo)背景音樂風(fēng)格信息對應(yīng)的背景音樂。
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述目標(biāo)交互風(fēng)格信息還包括目標(biāo)顯示畫面風(fēng)格信息;
所述方法還包括:
顯示所述目標(biāo)畫面風(fēng)格信息對應(yīng)的畫面。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取用戶的圖像數(shù)據(jù)之后,所述方法還包括:
基于所述用戶的圖像數(shù)據(jù),確定所述用戶的賬戶,獲取所述賬戶對應(yīng)的目標(biāo)畫面風(fēng)格信息;
顯示所述目標(biāo)畫面風(fēng)格信息對應(yīng)的畫面。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取用戶的圖像數(shù)據(jù)之前,所述方法還包括:
隨機(jī)顯示多種畫面風(fēng)格信息對應(yīng)的畫面;
獲取在顯示多種畫面風(fēng)格信息對應(yīng)的畫面時,所述用戶的圖像數(shù)據(jù);
將多種畫面風(fēng)格信息對應(yīng)的所述用戶的圖像數(shù)據(jù),分別輸入所述用戶屬性狀態(tài)分析模型,得到多種畫面風(fēng)格信息對應(yīng)的屬性狀態(tài)信息,所述屬性狀態(tài)信息包括表情信息;
基于多種畫面風(fēng)格信息對應(yīng)的表情信息,在所述多種畫面風(fēng)格信息中選取目標(biāo)畫面風(fēng)格信息;
將所述目標(biāo)畫面風(fēng)格信息與當(dāng)前登錄的所述賬戶對應(yīng)存儲。
7.一種進(jìn)行自動語音應(yīng)答處理的裝置,其特征在于,所述裝置包括:
獲取模塊,被配置為獲取用戶的圖像數(shù)據(jù);
第一確定模塊,被配置為基于所述圖像數(shù)據(jù)和預(yù)先訓(xùn)練的用戶屬性狀態(tài)分析模型,確定所述用戶的屬性狀態(tài)信息;
識別模塊,被配置為對所述用戶的圖像數(shù)據(jù)進(jìn)行人臉識別,基于所述用戶的圖像數(shù)據(jù),確定所述用戶的賬戶,獲取所述賬戶的歷史操作信息,其中,所述歷史操作信息中包括消費(fèi)信息、感興趣商品;
第二確定模塊,被配置為基于所述屬性狀態(tài)信息、所述歷史操作信息和預(yù)先訓(xùn)練的交互風(fēng)格分析模型,確定對所述用戶進(jìn)行自動語音應(yīng)答的目標(biāo)交互風(fēng)格信息;
處理模塊,被配置為基于所述目標(biāo)交互風(fēng)格信息,進(jìn)行自動語音應(yīng)答處理。
8.一種計算機(jī)設(shè)備,其特征在于,所述計算機(jī)設(shè)備包括處理器和存儲器,所述存儲器中存儲有至少一條指令,所述至少一條指令由所述處理器加載并執(zhí)行以實現(xiàn)如權(quán)利要求1至權(quán)利要求6任一項所述的進(jìn)行自動語音應(yīng)答處理方法所執(zhí)行的操作。
9.一種計算機(jī)可讀存儲介質(zhì),其特征在于,所述存儲介質(zhì)中存儲有至少一條指令,所述至少一條指令由處理器加載并執(zhí)行以實現(xiàn)如權(quán)利要求1至權(quán)利要求6任一項所述的進(jìn)行自動語音應(yīng)答處理方法所執(zhí)行的操作。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣州騰訊科技有限公司,未經(jīng)廣州騰訊科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010114987.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





