[發明專利]基于隨機游走模型的熱點預測方法、裝置和計算機設備在審
| 申請號: | 202010518745.2 | 申請日: | 2020-06-09 |
| 公開(公告)號: | CN111723578A | 公開(公告)日: | 2020-09-29 |
| 發明(設計)人: | 曹立宇 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/295;G06K9/62;G06N20/00 |
| 代理公司: | 深圳市明日今典知識產權代理事務所(普通合伙) 44343 | 代理人: | 王杰輝 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 隨機 游走 模型 熱點 預測 方法 裝置 計算機 設備 | ||
1.一種基于隨機游走模型的熱點預測方法,其特征在于,包括:
獲取記載有指定知識的文獻數據;
提取所述文獻數據中預設的實體名稱,以及確定各所述實體名稱在文獻數據中的關聯關系;
將所述關聯關系輸入到預設的隨機游走模型中,計算各所述實體名稱之間的連接概率;所述隨機游走模型的算法公式為:
其中,PR(i)表示節點i的訪問概率,out(i)表示節點i的出度,d是決定繼續游走的概率,in(i)是與點i相連的點的集合,j是其他節點,u為每個實體名稱的節點,r為引入的變量;
根據所述連接概率確定所述熱點。
2.根據權利要求1所述的基于隨機游走模型的熱點預測方法,其特征在于,所述獲取記載有指定知識的文獻數據的步驟,包括:
到預設的論文網站上下載論文的標題和摘要,將所述標題和摘要作為所述文獻數據。
3.根據權利要求1所述的基于隨機游走模型的熱點預測方法,其特征在于,所述文獻數據為論文,所述提取所述文獻數據中預設的實體名稱,以及確定各所述實體名稱在文獻數據中的關聯關系的步驟,包括:
在所述論文的摘要中查找預設的縮寫格式,并提取縮寫格式中的縮寫名稱,以及縮寫格式之前對應縮寫名稱的完整實體名稱;
將所述論文中的所述縮寫名稱替換成所述完整實體名稱;
在完成縮寫名稱替換的摘要中提取所述實體名稱,以及確定各所述實體名稱在文獻數據中的關聯關系。
4.根據權利要求1所述的基于隨機游走模型的熱點預測方法,其特征在于,所述提取所述文獻數據中預設的實體名稱,以及確定各所述實體名稱在文獻數據中的關聯關系的步驟,包括:
將所述文獻數據以句為單位進行劃分;
提取每一句中的所述實體名稱;
若同一句中出現兩種或兩種以上的所述實體名稱,則判定該句子中相鄰的兩個所述實體名稱具有關聯關系。
5.根據權利要求4所述的基于隨機游走模型的熱點預測方法,其特征在于,所述提取每一句中的實體名稱的步驟,包括:
利用預訓練模型BERT對每一句中的文字進行進行語意編碼;
在所述語義編碼中查找與各預設的實體名稱的語義編碼的相似度大于預設相似度閾值,且相似度最大的第一語義編碼;
將所述第一語義編碼對應的名稱轉換成與其對應的所述實體名稱。
6.根據權利要求1所述的基于隨機游走模型的熱點預測方法,其特征在于,所述獲取記載有指定知識的文獻數據的步驟之前,包括:
到預設的論文網站上按照預設的時間間隔長度,下載多個不同歷史時間段的歷史文獻數據;
提取各所述歷史文獻數據中的實體名稱,以及各所述實體名稱在所述歷史文獻數據中的歷史關聯關系;
將所述歷史關聯關系輸入到所述隨機游走模型中,計算各所述實體名稱之間的歷史連接概率;
依據所述歷史連接概率確定每一個歷史文獻數據對應的歷史時間段的歷史熱點;
接收用戶輸入的各所述歷史熱點是否為真實的熱點的判斷結果;
若多個歷史熱點的正確概率大于預設概率值,則判定所述隨機游走模型可用。
7.一種基于隨機游走模型的熱點預測裝置,其特征在于,包括:
獲取單元,用于獲取記載有指定知識的文獻數據;
提取單元,用于提取所述文獻數據中預設的實體名稱,以及確定各實體名稱在文獻數據中的關聯關系;
計算單元,用于將所述關聯關系輸入到預設的隨機游走模型中,計算各所述實體名稱之間的連接概率;所述隨機游走模型的算法公式為:
其中,PR(i)表示節點i的訪問概率,out(i)表示節點i的出度,d是決定繼續游走的概率,in(i)是與點i相連的點的集合,j是其他節點,u為每個實體名稱的節點,r為引入的變量;
確定單元,用于根據所述連接概率確定所述熱點。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010518745.2/1.html,轉載請聲明來源鉆瓜專利網。





