[發明專利]政務圖譜模型構建方法、裝置、設備及計算機可讀介質在審
| 申請號: | 202011409775.6 | 申請日: | 2020-12-04 |
| 公開(公告)號: | CN112463985A | 公開(公告)日: | 2021-03-09 |
| 發明(設計)人: | 鄧亮;王曉旭 | 申請(專利權)人: | 北京明略軟件系統有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/35;G06F40/30;G06F16/951;G06Q50/26 |
| 代理公司: | 北京華夏泰和知識產權代理有限公司 11662 | 代理人: | 曾軍;杜欣 |
| 地址: | 100084 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 政務 圖譜 模型 構建 方法 裝置 設備 計算機 可讀 介質 | ||
1.一種政務圖譜模型構建方法,其特征在于,包括:
獲取目標政務數據,其中,所述目標政務數據為從互聯網政務領域中采集得到的,用于表示法人擴展信息;
從預設的法人圖譜知識庫中提取與所述目標政務數據匹配的圖譜知識,其中,所述法人圖譜知識庫為根據通用政務知識圖譜的構建數據得到的;
利用所述圖譜知識對所述目標政務數據構建所述法人擴展信息的知識圖譜。
2.根據權利要求1所述的方法,其特征在于,獲取目標政務數據包括以下方式中的至少一種:
從第一抓取鏈路的起始頁開始,依次抓取所述第一抓取鏈路中的各個頁面中的所述目標政務數據;在所述第一抓取鏈路的所有頁面均抓取完畢且不滿足結束條件的情況下,繼續從第二抓取鏈路的起始頁開始,依次抓取所述第二抓取鏈路中的各個頁面中的所述目標政務數據,直至滿足所述結束條件時,終止抓取數據;
抓取當前頁面中的所述目標政務數據;在不滿足所述結束條件的情況下,從所述當前頁面中的多個鏈接中確定目標鏈接,并抓取所述目標鏈接所指向的目標頁面中的所述目標政務數據,直至滿足所述結束條件時,終止抓取數據。
3.根據權利要求1所述的方法,其特征在于,從預設的法人圖譜知識庫中提取與所述目標政務數據匹配的圖譜知識包括:
提取所述目標政務數據所要構建的所述知識圖譜的模型標識;
從預設的所述法人圖譜知識庫中提取與所述模型標識匹配的數據分類標簽、數據編碼標準及實體關聯關系中的至少一種。
4.根據權利要求3所述的方法,其特征在于,利用所述圖譜知識對所述目標政務數據構建所述法人擴展信息的知識圖譜包括:
利用所述數據分類標簽對所述目標政務數據進行分類,其中,所述數據分類標簽包括工商信息、股東信息、主要人員信息、分支機構信息、年報信息、稅務評級、違法信息、司法協助信息及失信人信息中的至少一種;
將分類后的所述目標政務數據按照所述數據編碼標準進行編碼;
按照所述實體關聯關系對編碼后的所述目標政務數據進行關聯;
利用關聯后的所述目標政務數據構建所述知識圖譜。
5.根據權利要求4所述的方法,其特征在于,利用關聯后的所述目標政務數據構建所述知識圖譜,包括:
從所述目標政務數據中確定目標法人;
提取所述目標法人的本體數據集,其中,所述本體數據集中的數據用于表示與所述目標法人關聯的對象、企業、社會組織、道路、樓房及互聯網文本中的至少一種;
以所述目標法人為主實體,以所述目標法人所在的業務領域為子實體,按照所述本體數據集指示的所述對象、企業、社會組織、樓房、道路及互聯網文本之間的關聯關系構建所述主實體與所述子實體、所述子實體與所述子實體之間的關聯邊。
6.根據權利要求3至5任一所述的方法,其特征在于,從預設的法人圖譜知識庫中提取與所述目標政務數據匹配的圖譜知識之前,所述方法還包括按照如下方式中的至少一種確定所述數據分類標簽,并將所述數據分類標簽保存在所述法人圖譜知識庫中:
獲取第一參照數據集;將所述第一參照數據集中的數據轉換為特征向量;確定所述特征向量之間的余弦相似度,并將所述余弦相似度小于目標閾值的所述特征向量歸為同一個分類數據集中;確定不同的所述分類數據集的所述數據分類標簽,并將所述數據分類標簽和所述分類數據集保存在所述法人圖譜知識庫中;
獲取第二參照數據集,其中,所述第二參照數據集用表結構進行保存;對所述表結構的所述第二參照數據集進行語義識別;按照識別結果進行分類;確定每一類的所述數據分類標簽;將所述數據分類標簽和所述識別結果保存在所述法人圖譜知識庫中。
7.根據權利要求1至5任一所述的方法,其特征在于,利用所述圖譜知識對所述目標政務數據構建所述法人擴展信息的知識圖譜之后,所述方法還包括:
獲取驗證數據;
利用所述驗證數據對所述法人擴展信息的所述知識圖譜進行驗證;
在驗證結果指示所述知識圖譜的準確率達到目標閾值時,驗證通過。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京明略軟件系統有限公司,未經北京明略軟件系統有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011409775.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:線頭無人化搬運系統的方法
- 下一篇:一種機電設備維修用減震裝置





