[發明專利]船舶現場監督知識圖譜的構建方法、裝置及電子設備在審
| 申請號: | 202211427336.7 | 申請日: | 2022-11-15 |
| 公開(公告)號: | CN115905563A | 公開(公告)日: | 2023-04-04 |
| 發明(設計)人: | 劉東;程欣;項邦豪;甘浪雄;鄧巍;李克丁;陳淦軒;束亞清;周春輝;鄧正州;安甫君;陳晨;吳昊 | 申請(專利權)人: | 中華人民共和國鹽城海事局;武漢欣海遠航科技研發有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F40/295;G06N5/02;G06F18/22;G06F18/241;G06F18/25 |
| 代理公司: | 武漢智嘉聯合知識產權代理事務所(普通合伙) 42231 | 代理人: | 姜婷 |
| 地址: | 224000 江蘇省鹽城市*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 船舶 現場 監督 知識 圖譜 構建 方法 裝置 電子設備 | ||
1.一種船舶現場監督知識圖譜的構建方法,其特征在于,包括:
構建船舶現場監督知識圖譜的本體模型和知識庫,并從所述知識庫中抽取目標項目類實體;所述知識庫包括實體名稱、實體間關系、實體屬性名稱與屬性值;
確定所述目標項目類實體中的待融合實體,并確定所述待融合實體對應的Jaccard系數相似度、Jaro-Winkler相似度和uSIF相似度;
將所述Jaccard系數相似度、所述Jaro-Winkler相似度和所述uSIF相似度輸入至預設的知識融合模型,得到待融合實體是否融合的結果;所述知識融合模型是基于XGBoosT模型訓練得到;
在基于所述待融合實體是否融合的結果確定所述待融合實體需融合的情況下,對所述待融合實體進行實體屬性補全和關聯對齊,得到知識融合數據;
將所述本體模型映射到所述知識融合數據,得到船舶現場監督知識圖譜。
2.根據權利要求1所述的船舶現場監督知識圖譜的構建方法,其特征在于,所述構建船舶現場監督知識圖譜的本體模型和知識庫,包括:
從目標網站爬取船舶現場監督相關的航運網站數據,以及獲取船舶現場監督相關的法律法規數據和歷史檢查數據;
對所述航運網站數據進行數據清洗,形成航運網站數據表,對所述法律法規數據進行數字化處理和格式化處理,形成法律法規數據表,對所述歷史檢查數據進行數據清洗,形成歷史檢查數據表;
基于所述航運網站數據表、所述法律法規數據表和所述歷史檢查數據表,確定船舶現場監督知識圖譜的領域范圍,在所述領域范圍內確定實體層級結構以及實體關系屬性,基于所述實體層級結構和所述實體關系屬性,得到所述本體模型。
3.根據權利要求2所述的船舶現場監督知識圖譜的構建方法,其特征在于,所述構建船舶現場監督知識圖譜的本體模型和知識庫,還包括:
對所述航運網站數據表、所述法律法規數據表和所述歷史檢查數據表進行知識抽取,得到所述知識庫。
4.根據權利要求2所述的船舶現場監督知識圖譜的構建方法,其特征在于,所述基于所述航運網站數據表、所述法律法規數據表和所述歷史檢查數據表,確定船舶現場監督知識圖譜的領域范圍,在所述領域范圍內確定實體層級結構以及實體關系屬性,基于所述實體層級結構和所述實體關系屬性,得到所述本體模型,包括:
基于所述航運網站數據表、所述法律法規數據表和所述歷史檢查數據表,以及預設的船舶現場監督概念和業務需求,確定船舶現場監督領域范圍;
在所述船舶現場監督領域范圍內,確定本體概念類及其屬性、本體概念類之間的關系及其屬性;
對所述本體概念類及其屬性、所述本體概念類之間的關系及其屬性進行可視化處理,得到所述本體模型。
5.根據權利要求2所述的船舶現場監督知識圖譜的構建方法,其特征在于,所述從所述知識庫中抽取目標項目類實體,包括:
基于所述法律法規數據表和所述歷史檢查數據表,得到船舶現場監督文本;所述船舶現場監督文本包括:所述法律法規數據表中的條款內容以及所述歷史檢查數據表中的缺陷內容;
對所述船舶現場監督文本對應的實體進行分類和細粒度知識抽取,得到目標實體;
將所述船舶現場監督文本和所述目標實體輸入至預設的實體識別模型,以提取所述船舶現場監督文本的語義特征,并基于所述語義特征和所述目標實體確定全局最優的實體標簽序列,基于所述全局最優的實體標簽序列得到所述目標項目類實體。
6.根據權利要求5所述的船舶現場監督知識圖譜的構建方法,其特征在于,所述實體識別模型,包括:
所述RoBERTa-wwm-ext嵌入層,用于確定所述船舶現場監督文本對應的語義特征,并輸出語義特征對應的低維特征向量;
所述BiLSTM層,用于基于所述低維特征向量,得到每一字符的標簽序列概率矩陣,并基于所述標簽序列概率矩陣對所述目標實體進行推斷標注;
所述CRF層,用于從標注后的目標實體中確定全局最優的實體標簽序列,基于所述全局最優的實體標簽序列得到所述目標項目類實體。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中華人民共和國鹽城海事局;武漢欣海遠航科技研發有限公司,未經中華人民共和國鹽城海事局;武漢欣海遠航科技研發有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211427336.7/1.html,轉載請聲明來源鉆瓜專利網。





