[發明專利]知識庫問題挖掘方法、裝置、電子設備及存儲介質在審
| 申請號: | 202011478825.6 | 申請日: | 2020-12-15 |
| 公開(公告)號: | CN112541067A | 公開(公告)日: | 2021-03-23 |
| 發明(設計)人: | 史文鑫 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/335;G06F16/35 |
| 代理公司: | 深圳市沃德知識產權代理事務所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 知識庫 問題 挖掘 方法 裝置 電子設備 存儲 介質 | ||
1.一種知識庫問題挖掘方法,其特征在于,所述方法包括:
接收原始問題集,對所述原始問題集進行清洗和去重,得到訓練問題集;
利用預先訓練完成的問題特征抽取模型對所述訓練問題集進行特征提取,得到問題特征集;
將所述問題特征集進行聚類,得到聚類問題集,并從所述聚類問題集中提取標準問題集;
利用所述標準問題集對預構建的問題挖掘模型進行迭代訓練,得到標準問題挖掘模型;
利用測試問題集對所述標準問題挖掘模型進行性能評估,得到所述標準問題挖掘模型的評估分數;
根據所述評估分數,評估所述標準問題挖掘模型是否達到上線標準;
若所述標準問題挖掘模型未達到所述上線標準,則重新返回利用預先訓練完成的問題特征抽取模型對所述訓練問題集進行特征提取的步驟;
若所述標準問題挖掘模型達到所述上線標準,則利用所述標準問題挖掘模型對待挖掘的問題集進行問題挖掘,得到擴展問題。
2.如權利要求1所述的知識庫問題挖掘方法,其特征在于,所述利用預先訓練完成的問題特征抽取模型對所述訓練問題集進行特征提取,得到問題特征集,包括:
利用所述問題特征抽取模型中的卷積層,對所述訓練問題集進行卷積操作,得到特征向量集;
利用所述問題特征抽取模型中的目標函數對所述特征向量集進行特征計算,得到問題特征集。
3.如權利要求1所述的知識庫問題挖掘方法,其特征在于,所述將所述問題特征集進行聚類,得到聚類問題集,包括:
步驟A、利用預設聚類類別個數選擇算法從所述問題特征集中選擇K個問題特征作為初始聚類中心;
步驟B、計算所述問題特征集中每個問題特征與所述初始聚類中心的距離值,并根據所述距離值將所述問題特征集進行初始聚類,得到初始聚類問題集;
步驟C、計算所述初始聚類問題集中每個問題特征的中心,將所述中心作為新聚類中心;
步驟D、計算所述問題特征集中每個問題特征與所述新聚類中心的距離值,并根據所述距離值將所述問題特征集再次聚類,并重復執行上述的步驟A至步驟D,直到完成預設循環次數,得到聚類問題集。
4.如權利要求1所述的知識庫問題挖掘方法,其特征在于,所述從所述聚類問題集中提取標準問題集,包括:
利用下述匹配度計算方法,計算所述聚類問題集與預構建的標準問題庫中標準問題的語句匹配度T(x,y):
其中,xi表示聚類問題集的第i個聚類問題,yi表示標準問題庫中的第i個標準問題;
根據所述語句匹配度,將匹配成功的聚類問題集作為標準問題集。
5.如權利要求1所述的知識庫問題挖掘方法,其特征在于,所述利用所述標準問題集對預構建的問題挖掘模型進行迭代訓練,得到標準問題挖掘模型之前,所述方法還包括:
將所述訓練完成的問題特征抽取模型、預設的自編碼問題聚類算法模型以及相對熵損失函數進行合并,得到問題挖掘模型。
6.如權利要求5所述的知識庫問題挖掘方法,其特征在于,所述利用所述標準問題集迭代訓練預構建的問題挖掘模型,得到標準問題挖掘模型,包括:
利用所述問題特征抽取模型對所述標準問題集進行特征提取,得到標準問題特征集;
利用所述自編碼問題聚類算法模型對所述標準問題特征集進行壓縮降維,得到標準問題特征表征集;
計算所述標準問題特征表征集與預設的標準問題中心的距離值,根據所述距離值,利用預設的概率分布函數計算所述標準問題特征表征集的概率分布;
利用所述相對熵損失函數計算所述概率分布與預設理想分布的相對熵值;
當所述相對熵值不小于預設閾值時,調整所述所述標準問題挖掘模型的內部參數,直到所述相對熵值小于所述預設閾值時,得到標準問題挖掘模型。
7.如權利要求1所述的知識庫問題挖掘方法,其特征在于,所述利用所述標準問題挖掘模型對待挖掘的問題集進行問題挖掘,得到擴展問題之后,還包括:
將所述擴展問題轉換成標準問題-擴展問題的格式后添加至預設知識庫中。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011478825.6/1.html,轉載請聲明來源鉆瓜專利網。





