[發明專利]基于知識圖譜的科技服務推薦方法、裝置、設備及存儲介質有效
| 申請號: | 202110508376.3 | 申請日: | 2021-05-10 |
| 公開(公告)號: | CN113220996B | 公開(公告)日: | 2022-09-27 |
| 發明(設計)人: | 孫圣力;徐嘉辰;李青山;司華友 | 申請(專利權)人: | 北京大學;南京博雅區塊鏈研究院有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/36;G06F16/951;G06F40/295;G06N3/04;G06N3/08 |
| 代理公司: | 無錫永樂唯勤專利代理事務所(普通合伙) 32369 | 代理人: | 孫際德 |
| 地址: | 100000*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 知識 圖譜 科技服務 推薦 方法 裝置 設備 存儲 介質 | ||
1.一種基于知識圖譜的科技服務推薦方法,其特征在于,包括:
獲取科技服務需求對象的包括有若干流程環節的流程文檔,及各所述流程環節對應的需求文檔;
獲取各所述流程環節對應的需求文檔的初始關鍵詞;
使用網絡爬蟲爬取到各所述流程環節的初始科技服務文檔;
基于命名實體抽取模型及所述初始科技服務文檔抽取出所述初始科技服務文檔所涉及的初始命名實體;
使用抽取出的初始命名實體對所述初始關鍵詞進行擴充得到各所述流程環節對應的需求文檔的擴充關鍵詞;
基于所述流程環節對應的需求文檔的擴充關鍵詞獲得各所述流程環節的最終科技服務文檔;
基于命名實體抽取模型及所述最終科技服務文檔抽取出所述最終科技服務文檔所涉及的擴充命名實體;
基于關系抽取模型、所述的最終科技服務文檔及所述擴充命名實體抽取出各所述擴充命名實體之間的關系;
將所述擴充命名實體及各所述擴充命名實體之間的關系存儲至圖數據庫中以形成知識圖譜;
基于知識圖譜實施對科技服務需求對象的科技服務推薦;
所述獲取各所述流程環節對應的需求文檔的初始關鍵詞包括:
采用jieba中文分詞方法對所述流程環節對應的需求文檔進行分詞處理,并剔除其中的停用詞,統計出高頻詞作為所述初始關鍵詞;
所述使用網絡爬蟲爬取到各所述流程環節的初始科技服務文檔包括:
針對各所述流程環節,使用網絡爬蟲分別從選定的目標網絡平臺上爬取到若干候選科技服務文檔;
計算各所述候選科技服務文檔與對應的需求文檔的初始關鍵詞之間的相關度,選擇相關度大于預定閾值的所述候選科技服務文檔作為所述初始科技服務文檔。
2.如權利要求1所述的科技服務推薦方法,其特征在于:
所述候選科技服務文檔為詞數少于預定閾值的短文本,所述計算各所述候選科技服務文檔與對應的需求文檔的初始關鍵詞之間的相關度包括:
采用jieba中文分詞方法對所述候選科技服務文檔進行分詞處理,并剔除其中的停用詞,并統計出其中的高頻詞作為所述候選科技服務文檔的關鍵詞;
使用word2vec模型分別將所述候選科技服務文檔的關鍵詞和對應的需求文檔的初始關鍵詞映射為詞向量;
基于所述候選科技服務文檔和所述需求文檔的初始關鍵詞的詞向量計算所述候選科技服務文檔與所述需求文檔的初始關鍵詞之間的相關度。
3.如權利要求1所述的科技服務推薦方法,其特征在于:
所述候選科技服務文檔為詞數等于或多于預定閾值的長文本,所述計算各所述候選科技服務文檔與對應的需求文檔的初始關鍵詞之間的相關度包括:
采用LDA模型從所述選科技服務文檔中抽取出關鍵詞;
使用word2vec模型分別將所述候選科技服務文檔的關鍵詞和對應的需求文檔的初始關鍵詞映射為詞向量;
基于所述候選科技服務文檔和所述需求文檔的初始關鍵詞的詞向量計算所述候選科技服務文檔與所述需求文檔的初始關鍵詞之間的相關度。
4.如權利要求1所述的科技服務推薦方法,其特征在于,所述命名實體抽取模型為BERT-BILSTM-CRF中文命名識別算法模型,
所述基于命名實體抽取模型及所述初始科技服務文檔抽取出所述初始科技服務文檔所涉及的初始命名實體包括:
構建BERT-BILSTM-CRF中文命名識別算法模型;
獲取若干所述初始科技服務文檔并利用數據標注平臺對各所述初始科技服務文檔進行BIO標注以形成經標注后的訓練樣本集,利用訓練樣本集完成對所述BERT-BILSTM-CRF中文命名識別算法模型的訓練;
將所述初始科技服務文檔輸入至訓練好的所述BERT-BILSTM-CRF中文命名識別算法模型,以抽取出所述初始科技服務文檔的初始命名實體。
5.如權利要求1所述的科技服務推薦方法,其特征在于,所述圖數據庫為Neo4j圖數據庫。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京大學;南京博雅區塊鏈研究院有限公司,未經北京大學;南京博雅區塊鏈研究院有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110508376.3/1.html,轉載請聲明來源鉆瓜專利網。





