[發(fā)明專利]進(jìn)行自動語音應(yīng)答處理的方法、裝置、設(shè)備及存儲介質(zhì)有效

申請?zhí)枺?/td>	202010114987.5	申請日：	2020-02-25
公開（公告）號：	CN111327772B	公開（公告）日：	2021-09-17
發(fā)明（設(shè)計）人：	原俊;郭潤增;黃家宇;吳志偉;張穎;耿志軍	申請（專利權(quán)）人：	廣州騰訊科技有限公司
主分類號：	G10L15/22	分類號：	G10L15/22;H04M3/493;G10L15/24;G10L15/26;G10L17/22;G06F16/332;G06F16/335;G06F16/635;G06F16/64;G06F16/683;G06K9/00
代理公司：	北京三高永信知識產(chǎn)權(quán)代理有限責(zé)任公司 11138	代理人：	祝亞男
地址：	510310 廣東省廣***	國省代碼：	廣東;44
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	進(jìn)行自動語音應(yīng)答處理方法裝置設(shè)備存儲介質(zhì)
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【權(quán)利要求書】：

1.一種進(jìn)行自動語音應(yīng)答處理的方法，其特征在于，所述方法包括：

獲取用戶的圖像數(shù)據(jù)；

基于所述圖像數(shù)據(jù)和預(yù)先訓(xùn)練的用戶屬性狀態(tài)分析模型，確定所述用戶的屬性狀態(tài)信息；

對所述用戶的圖像數(shù)據(jù)進(jìn)行人臉識別，基于所述用戶的圖像數(shù)據(jù)，確定所述用戶的賬戶，獲取所述賬戶的歷史操作信息，其中，所述歷史操作信息中包括消費(fèi)信息、感興趣商品；

基于所述屬性狀態(tài)信息、所述歷史操作信息和預(yù)先訓(xùn)練的交互風(fēng)格分析模型，確定對所述用戶進(jìn)行自動語音應(yīng)答的目標(biāo)交互風(fēng)格信息；

基于所述目標(biāo)交互風(fēng)格信息，進(jìn)行自動語音應(yīng)答處理。

2.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述目標(biāo)交互風(fēng)格信息包括目標(biāo)語音風(fēng)格信息；

所述基于所述目標(biāo)語音風(fēng)格信息，進(jìn)行自動語音應(yīng)答處理，包括：

獲取用戶語音音頻；

對所述用戶音頻進(jìn)行識別，生成對應(yīng)的文字；

基于所述文字，以及預(yù)先訓(xùn)練的對話模型，確定目標(biāo)交互文字；

基于語音合成算法，與所述目標(biāo)語音風(fēng)格信息對應(yīng)的調(diào)節(jié)參數(shù)，將目標(biāo)交互文字轉(zhuǎn)化成與所述目標(biāo)語音風(fēng)格信息對應(yīng)的目標(biāo)應(yīng)答語音音頻；

播放所述目標(biāo)應(yīng)答語音音頻。

3.根據(jù)權(quán)利要求2所述的方法，其特征在于，所述目標(biāo)交互風(fēng)格信息還包括目標(biāo)背景音樂風(fēng)格信息；

所述方法還包括：

播放所述目標(biāo)背景音樂風(fēng)格信息對應(yīng)的背景音樂。

4.根據(jù)權(quán)利要求2所述的方法，其特征在于，所述目標(biāo)交互風(fēng)格信息還包括目標(biāo)顯示畫面風(fēng)格信息；

所述方法還包括：

顯示所述目標(biāo)畫面風(fēng)格信息對應(yīng)的畫面。

5.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述獲取用戶的圖像數(shù)據(jù)之后，所述方法還包括：

基于所述用戶的圖像數(shù)據(jù)，確定所述用戶的賬戶，獲取所述賬戶對應(yīng)的目標(biāo)畫面風(fēng)格信息；

顯示所述目標(biāo)畫面風(fēng)格信息對應(yīng)的畫面。

6.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述獲取用戶的圖像數(shù)據(jù)之前，所述方法還包括：

隨機(jī)顯示多種畫面風(fēng)格信息對應(yīng)的畫面；

獲取在顯示多種畫面風(fēng)格信息對應(yīng)的畫面時，所述用戶的圖像數(shù)據(jù)；

將多種畫面風(fēng)格信息對應(yīng)的所述用戶的圖像數(shù)據(jù)，分別輸入所述用戶屬性狀態(tài)分析模型，得到多種畫面風(fēng)格信息對應(yīng)的屬性狀態(tài)信息，所述屬性狀態(tài)信息包括表情信息；

基于多種畫面風(fēng)格信息對應(yīng)的表情信息，在所述多種畫面風(fēng)格信息中選取目標(biāo)畫面風(fēng)格信息；

將所述目標(biāo)畫面風(fēng)格信息與當(dāng)前登錄的所述賬戶對應(yīng)存儲。

7.一種進(jìn)行自動語音應(yīng)答處理的裝置，其特征在于，所述裝置包括：

獲取模塊，被配置為獲取用戶的圖像數(shù)據(jù)；

第一確定模塊，被配置為基于所述圖像數(shù)據(jù)和預(yù)先訓(xùn)練的用戶屬性狀態(tài)分析模型，確定所述用戶的屬性狀態(tài)信息；

識別模塊，被配置為對所述用戶的圖像數(shù)據(jù)進(jìn)行人臉識別，基于所述用戶的圖像數(shù)據(jù)，確定所述用戶的賬戶，獲取所述賬戶的歷史操作信息，其中，所述歷史操作信息中包括消費(fèi)信息、感興趣商品；

第二確定模塊，被配置為基于所述屬性狀態(tài)信息、所述歷史操作信息和預(yù)先訓(xùn)練的交互風(fēng)格分析模型，確定對所述用戶進(jìn)行自動語音應(yīng)答的目標(biāo)交互風(fēng)格信息；

處理模塊，被配置為基于所述目標(biāo)交互風(fēng)格信息，進(jìn)行自動語音應(yīng)答處理。

8.一種計算機(jī)設(shè)備，其特征在于，所述計算機(jī)設(shè)備包括處理器和存儲器，所述存儲器中存儲有至少一條指令，所述至少一條指令由所述處理器加載并執(zhí)行以實現(xiàn)如權(quán)利要求1至權(quán)利要求6任一項所述的進(jìn)行自動語音應(yīng)答處理方法所執(zhí)行的操作。

9.一種計算機(jī)可讀存儲介質(zhì)，其特征在于，所述存儲介質(zhì)中存儲有至少一條指令，所述至少一條指令由處理器加載并執(zhí)行以實現(xiàn)如權(quán)利要求1至權(quán)利要求6任一項所述的進(jìn)行自動語音應(yīng)答處理方法所執(zhí)行的操作。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費(fèi)下載。

免登錄下載普通用戶下載升級VIP會員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣州騰訊科技有限公司，未經(jīng)廣州騰訊科技有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202010114987.5/1.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。