[發明專利]一種知識庫構建方法及裝置有效
| 申請號: | 201910065035.6 | 申請日: | 2019-01-23 |
| 公開(公告)號: | CN109858626B | 公開(公告)日: | 2021-08-03 |
| 發明(設計)人: | 王卓然;亓超;馬宇馳;郭偉;陳華榮 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06N5/02 | 分類號: | G06N5/02 |
| 代理公司: | 深圳市深佳知識產權代理事務所(普通合伙) 44285 | 代理人: | 王仲凱 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 知識庫 構建 方法 裝置 | ||
本發明實施例公開了一種知識庫構建方法及裝置,涉及數據處理技術領域,主要目的在于構建高質量高覆蓋的行業知識庫;主要技術方案包括:基于素材文本形成待建知識庫的備選答案;收集所述待建知識庫的至少一個問題;對所述至少一個問題進行預處理,依據預處理后的問題,在所述備選答案中獲取所述預處理后的問題的答案;基于預處理后的問題以及與所述預處理后的問題的答案構建知識庫。
技術領域
本發明實施例涉及數據處理技術領域,特別是涉及一種知識庫構建方法及裝置。
背景技術
隨著計算機技術的飛速發展,各個行業為了更好的為客戶提供服務,智能客服系統越來越廣泛的應用在各行業中。智能客服系統通常基于知識庫回答用戶的問題。為了能夠為用戶反饋準確性較高的答案,需要構建高質量的知識庫。
目前,發明人在實現本發明實施例的過程中發現,智能客服系統的知識庫在構建時,通常需要人工手動從人工客服的歷史服務記錄中收集整理知識點(問題和答案組合成的問題答案對)。但是,這種人工手動收集的方式構建知識庫需要耗費大量的人力物力,整理周期較長耗時較多,而且收集整理知識點時僅依據人工客服的歷史服務記錄,整理出的知識庫內容不夠完備,導致智能客服系統對有些問題不能進行準確反饋。
發明內容
有鑒于此,本發明實施例提出了一種知識庫構建方法及裝置,主要目的在于構建高質量高覆蓋的知識庫。
第一方面,本發明實施例提供了一種知識庫構建方法,該方法包括:
基于素材文本形成待建知識庫的備選答案;
收集所述待建知識庫的至少一個問題;
對所述至少一個問題進行預處理,依據預處理后的問題,在所述備選答案中獲取所述預處理后的問題的答案;
基于預處理后的問題以及與所述預處理后的問題的答案構建知識庫。
第二方面,本發明實施例提供了一種知識庫構建裝置,該裝置包括:
形成模塊,用于基于素材文本形成待建知識庫的備選答案;
收集模塊,用于收集所述待建知識庫的至少一個問題;
獲取模塊,用于對所述至少一個問題進行預處理,依據預處理后的問題,在所述備選答案中獲取所述預處理后的問題的答案;
構建模塊,用于基于預處理后的問題以及與所述預處理后的問題的答案構建知識庫。
第三方面,本發明實施例提供了一種存儲介質,所述存儲介質存儲有多條指令,所述指令適用于由處理器加載并執行如上述中任意一項所述的知識庫構建方法。
第四方面,本發明實施例提供了一種電子設備,所述電子設備包括:存儲介質和處理器;
所述處理器,適于實現各指令;
所述存儲介質,適于存儲多條指令;
所述指令適于由所述處理器加載并執行如上述中任意一項所述的知識庫構建方法。
借由上述技術方案,本發明實施例提供的知識庫構建方法及裝置,首先基于素材文本形成待建知識庫的備選答案,并收集待建知識庫的問題。在對收集的問題進行預處理后,依據預處理后的問題在備選答案中獲取預處理后的問題的答案。最后基于預處理后的問題以及與預處理后的問題的答案構建知識庫。通過上述可知,本發明實施例提供的方案中問題的答案基于素材文本得到,而素材文本中覆蓋有大量的有價值的信息。基于素材文本得到的答案便涵蓋了這些有價值的信息,因此基于問題以及問題的答案便可以構建出高質量高覆蓋的知識庫。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910065035.6/2.html,轉載請聲明來源鉆瓜專利網。





