[發明專利]一種知識庫的挖掘方法及裝置有效
| 申請號: | 201810989083.X | 申請日: | 2018-08-28 |
| 公開(公告)號: | CN109189833B | 公開(公告)日: | 2021-10-01 |
| 發明(設計)人: | 劉鐵;王述振;田印;戚翠玲;高建斌 | 申請(專利權)人: | 中國銀聯股份有限公司 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458 |
| 代理公司: | 北京同達信恒知識產權代理有限公司 11291 | 代理人: | 黃志華 |
| 地址: | 200135 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 知識庫 挖掘 方法 裝置 | ||
本發明實施例涉及數據處理技術領域,尤其涉及一種知識庫的挖掘方法及裝置,用以降低超時交易的處理延時。本發明實施例包括:獲取系統中的源代碼;采集所述源代碼中各函數節點的屬性信息,所述屬性信息至少包括所述函數節點的關鍵詞以及函數節點之間的調用關系;根據所述函數節點之間的調用關系,建立業務流,所述業務流為包含一個或多個函數節點的完整路徑;針對一個業務流,根據所述業務流中函數節點的關鍵詞,確定所述業務流的關鍵詞;將所述業務流轉換為知識條目,將所述知識條目以及對應的業務流的關鍵詞錄入所述系統的知識庫中。
技術領域
本發明涉及數據處理技術領域,尤其涉及一種知識庫的挖掘方法及裝置。
背景技術
目前現有的智能支持應用通過采集知識庫的形式收集客戶問題,支持人員通過關鍵詞等語料信息在知識庫中查找問題,獲取問題的答案。
現有技術中構建知識庫的方法包括:計算機設備中的基礎數據處理層獲得網頁中的句子;計算機設備中的挖掘層對句子進行分詞;挖掘層將知識庫中第一類別對應的預設的標志詞與分詞后得到的詞進行匹配;挖掘層在至少有一個分詞后得到的詞匹配成功的情況下,將句子中與匹配成功的詞相鄰的未知字符串作為第一條目添加到第一類別中;當句子中的詞與知識庫中第二類別下的第二條目匹配時,挖掘層判斷第一類別與第二類別之間是否已建立關系,在建立有關系的情況下,為第一條目與第二條目建立關系。這種通過語料采集的形式構建知識庫的方法適用于非固定業務需求且對精準度要求不高的情況。
上述知識庫的支持方式要求知識庫具備海量的問題和答案的儲備,當應用遇到沒有收錄的問題時,無法直接提供支持服務。因此,現有技術中系統升級時,知識庫的更新或擴充會帶來繁重的工作量。
發明內容
本申請提供一種知識庫的挖掘方法及裝置,用以降低知識庫更新或擴充的工作量。
本發明實施例提供的一種知識庫的挖掘方法,包括:
獲取系統中的源代碼;
采集所述源代碼中各函數節點的屬性信息,所述屬性信息至少包括所述函數節點的關鍵詞以及函數節點之間的調用關系;
根據所述函數節點之間的調用關系,建立業務流,所述業務流為包含一個或多個函數節點的完整路徑;
針對一個業務流,根據所述業務流中函數節點的關鍵詞,確定所述業務流的關鍵詞;
將所述業務流轉換為知識條目,將所述知識條目以及對應的業務流的關鍵詞錄入所述系統的知識庫中。
可選的,所述根據所述函數節點之間的調用關系,建立業務流,包括:
根據所述函數節點之間的調用關系,以各函數節點為節點構建拓撲結構;
對所述拓撲結構進行遍歷,建立業務流,其中,一條業務流從所述拓撲結構的根節點開始,到所述拓撲結構的一個葉子節點結束。
可選的,所述根據所述函數節點之間的調用關系,以各函數節點為節點構建拓撲結構,包括:
若所述調用關系為循環流程,則以一次循環流程進行所述拓撲結構的構建。
可選的,所述對所述拓撲結構進行遍歷,建立業務流之后,確定所述業務流的關鍵詞之前,還包括:
將所述業務流中的非公開函數節點刪除。
可選的,所述根據所述業務流中函數節點的關鍵詞,確定所述業務流的關鍵詞,包括:
計算所述業務流中各函數節點的核心度分數;
根據核心度分數將各函數節點排序;
將核心度排序前N個函數節點的關鍵詞作為所述函數節點的關鍵詞。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國銀聯股份有限公司,未經中國銀聯股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810989083.X/2.html,轉載請聲明來源鉆瓜專利網。





