[發明專利]一種自動問答方法、裝置及存儲介質有效
| 申請號: | 201710872147.3 | 申請日: | 2017-09-25 |
| 公開(公告)號: | CN108304437B | 公開(公告)日: | 2020-01-31 |
| 發明(設計)人: | 張想;馮啟航;柯玉耿;林強 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/31;G06F16/335 |
| 代理公司: | 44300 深圳翼盛智成知識產權事務所(普通合伙) | 代理人: | 黃威 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 檢索問題 候選答案 存儲介質 倒排索引 自動問答 詞組 答案 集合 聊天機器人 目標答案 社交平臺 社交數據 系統輸出 匹配 輸出 | ||
本發明實施例公開了一種自動問答方法、裝置及存儲介質;本發明實施例采用基于社交平臺上的社交數據形成的多個問答對,該問答對包括問題及其對應的答案,然后,建立該問題與其詞組的倒排索引,獲取檢索問題,并根據該檢索問題的問題詞組以及該倒排索引確定與該檢索問題相近的相近問題,根據該相近問題以及該問答對獲取檢索問題的候選答案,得到檢索問題的候選答案集合,從該候選答案集合中選取該檢索問題的目標答案。該方案可以輸出與檢索問題相匹配的答案,提高了聊天機器人系統輸出答案的準確性和質量。
技術領域
本發明涉及人工智能技術領域,具體涉及一種自動問答方法、裝置及存儲介質。
背景技術
聊天機器人系統就是一種借助于通訊手段能夠時時刻刻在線、并通過自然語言與人溝通交流的人工智能系統。聊天機器人系統實質上是一種自動問答(QA)系統。該自動問答系統,也叫問題回答系統,是記憶一個大語料庫,自動檢索查找并回答用戶提問的計算機處理系統。
具體地,聊天機器人系統在用戶輸入問題后,會在數據庫中檢索與該問題匹配的答案,然后,輸出該檢索到的答案,以答復用戶輸入的問題,進而實現聊天。
然而,目前聊天機器人系統經常會出現答案與問題不匹配的情況,答案相關性較差,降低了聊天機器人系統輸出答案的準確性。
發明內容
本發明實施例提供一種自動問答方法、裝置及存儲介質,可以提高聊天機器人系統輸出答案的準確性。
本發明實施例提供一種自動問答方法,包括:
基于社交平臺上的社交數據形成的多個問答對,所述問答對包括問題及其對應的答案;
建立所述問題與其詞組的倒排索引;
獲取檢索問題,并根據所述檢索問題的問題詞組以及所述倒排索引確定與所述檢索問題相近的相近問題;
根據所述相近問題以及所述問答對獲取檢索問題的候選答案,得到檢索問題的候選答案集合;
從所述候選答案集合中選取所述檢索問題的目標答案。
相應的,本發明實施例還提供一種自動問答裝置,包括:
問答對形成單元,用于基于社交平臺上的社交數據形成的多個問答對,所述問答對包括問題及其對應的答案;
索引建立單元,用于建立所述問題與其詞組的倒排索引;
問題獲取單元,用于獲取檢索問題,并根據所述檢索問題的問題詞組以及所述倒排索引確定與所述檢索問題相近的相近問題;
候選答案獲取單元,用于根據所述相近問題以及所述問答對獲取檢索問題的候選答案,得到檢索問題的候選答案集合;
答案選取單元,用于從所述候選答案集合中選取所述檢索問題的目標答案。
相應的,本發明實施例還提供一種存儲介質,所述存儲介質存儲有指令,所述指令被處理器執行時實現本發明實施例任一提供的自動問答方法。
本發明實施例采用基于社交平臺上的社交數據形成的多個問答對,所述問答對包括問題及其對應的答案,然后,建立所述問題與其詞組的倒排索引,獲取檢索問題,并根據所述檢索問題的問題詞組以及所述倒排索引確定與所述檢索問題相近的相近問題,根據所述相近問題以及所述問答對獲取檢索問題的候選答案,得到檢索問題的候選答案集合,從所述候選答案集合中選取所述檢索問題的目標答案。該方案可以先查詢與檢索問題相近的相近問題,并查詢相近問題對應的答案,再從相近問題的答案中選取最合適的答案,因此,該方案可以輸出與檢索問題相匹配的答案,提高了聊天機器人系統輸出答案的準確性和質量。
附圖說明
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710872147.3/2.html,轉載請聲明來源鉆瓜專利網。





