[發明專利]基于問答設備的問答數據的處理方法和裝置在審
| 申請號: | 201911382071.1 | 申請日: | 2019-12-27 |
| 公開(公告)號: | CN113051375A | 公開(公告)日: | 2021-06-29 |
| 發明(設計)人: | 繆瑜;郭靜雅;莊亦村;楊晨;王利華;單利民;劉奎龍;楊昌源;陳國君;吳燕晶;楊文波 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/33;G06F40/30 |
| 代理公司: | 北京博浩百睿知識產權代理有限責任公司 11134 | 代理人: | 謝湘寧;張文華 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 問答 設備 數據 處理 方法 裝置 | ||
1.一種基于問答設備的問答數據的處理方法,其特征在于,包括:
獲取待反饋給前端設備的問答語句,其中,所述問答語句包括如下至少之一:問題語句和回答語句;
根據所述問答語句預測得到至少一個目標詞語;
基于詞庫對所述至少一個目標詞語進行分析處理,得到構成下一次提問的問題語句的問題詞語;
對構成所述下一次提問的問題語句的問題詞語進行組合,生成所述下一次提問的問題語句。
2.根據權利要求1所述的方法,其特征在于,根據所述問答語句預測得到至少一個目標詞語,包括:
對所述問答語句進行分詞,得到所述問答語句的分詞結果;
根據所述分詞結果中每個分詞的詞性,從所述分詞結果中選擇出具有預設詞性的關鍵詞語;
根據所述關鍵詞語預測至少一個所述目標詞語。
3.根據權利要求2所述的方法,其特征在于,根據所述關鍵詞語預測至少一個所述目標詞語,包括:
從所述詞庫中查找所述關鍵詞語對應的同義詞;
確定所述同義詞為預測得到的至少一個所述目標詞語。
4.根據權利要求2所述的方法,其特征在于,根據所述問答語句預測得到至少一個目標詞語還包括:
確定所述詞庫中不存在所述關鍵詞語對應的同義詞;
將所述問答語句的分詞結果進行向量化處理,得到所述問答語句對應的語句向量;
基于所述語句向量根據非負矩陣分解算法預測至少一個所述目標詞語。
5.根據權利要求4所述的方法,其特征在于,基于所述語句向量根據非負矩陣分解算法預測至少一個所述目標詞語,包括:
將所述語句向量輸入所述非負矩陣分解算法模型,得到所述非負矩陣分解算法模型輸出的概率矩陣,其中,所述概率矩陣用于預測所述關鍵詞語對應的候選目標詞語是下一次提問的目標詞語的概率;
確定概率最大的候選目標詞語為至少一個所述目標詞語。
6.根據權利要求2所述的方法,其特征在于,基于詞庫對所述至少一個目標詞語進行分析處理,得到構成下一次提問的問題語句的問題詞語,包括:
對所述分詞結果進行編碼,得到每個分詞的隱狀態;
對所述隱狀態進行解碼,得到解碼結果;
根據所述解碼結果和已生成的問題詞語得到所述下一次提問的問題語句中當前位置的問題詞語的狀態信息;
根據所述狀態信息確定構成所述下一次提問的問題語句中當前位置的問題詞語。
7.根據權利要求6所述的方法,其特征在于,根據所述解碼結果和已生成的問題詞語得到所述下一次提問的問題語句中當前位置的問題詞語的狀態信息,包括:
基于所述狀態信息,預測所述當前位置的問題詞語關于詞組類別的第一概率分布,其中,所述第一概率分布用于表示所述當前位置的問題詞語屬于任意一個詞組類別的概率,所述詞庫被分為多個詞組類別;
基于所述狀態信息,預測所述當前位置關于詞語的第二概率分布,其中,所述第二概率分布用于表示所述當前位置為任意一個詞語的后驗分布;
根據所述第一概率分布和所述第二概率分布,得到所述當前位置相對于詞語類別和詞語的聯合分布;
確定所述聯合分布中概率值最大的詞語為所述當前位置的問題詞語。
8.根據權利要求7所述的方法,其特征在于,所述詞組類別包括:疑問詞、話題詞以及普通詞匯,所述普通詞匯是除所述疑問詞和所述話題詞之外的其他詞匯。
9.根據權利要求1所述的方法,其特征在于,在獲取待反饋給前端設備的問答語句之前,所述方法還包括:
獲取所述前端設備接收到的歷史對話數據;
根據所述歷史對話數據確定首次提問的目標詞語,并基于所述首次提問的目標詞語確定所述首次提問的問題語句,并主動向所述前端設備發送所述問題語句。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911382071.1/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





