[發明專利]一種食品安全標準關聯知識圖譜構建方法及系統在審
| 申請號: | 202211087778.1 | 申請日: | 2022-09-07 |
| 公開(公告)號: | CN115658911A | 公開(公告)日: | 2023-01-31 |
| 發明(設計)人: | 段敏;劉鵬;劉文;戴岳;劉樸真;黃蓉 | 申請(專利權)人: | 中國標準化研究院 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06N5/02;G06F16/901;G06F40/289;G06F40/216;G06F16/33 |
| 代理公司: | 北京睿智保誠專利代理事務所(普通合伙) 11732 | 代理人: | 韓迎之 |
| 地址: | 100191*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 食品 安全標準 關聯 知識 圖譜 構建 方法 系統 | ||
本發明公開了一種食品安全標準關聯知識圖譜構建方法及系統,涉及食品安全技術領域,首先獲取食品安全標準數據源;對食品安全標準數據源中的結構化數據和非結構化數據進行語義識別,得到知識數據集;對每條知識進行分詞處理;基于TF?IDF算法,計算每條知識中每個分詞所占權重;將每條知識中每個分析的權重和預設閾值進行比較,將符合閾值條件的分詞作為該條知識的標簽;依據標簽所代表的實體之間的關系,構建食品安全標準關聯知識圖譜。本發明能夠提高食品安全標準關聯知識圖譜構建過程的工作效率,同時還能夠提高每條知識所帶標簽的科學性和準確性。
技術領域
本發明涉及食品安全技術領域,更具體的說是涉及一種食品安全標準關聯知識圖譜構建方法及系統。
背景技術
食品安全領域的數據量龐大,有海量的相關法律法規、國家標準、地方標準等,知識圖譜的興起對數據的存儲方式產生了極大地改變,真實世界的數據也往往以知識圖譜的形式進行展現,知識圖譜可以更加豐富的展現重大活動食品安全數據信息,現有技術中通常是將所有的法律法規、國家標準、地方標準的知識都關聯起來,形成食品安全知識圖譜,以表示食品生產過程中各類因果關聯。對于食品從業者來說,可以代替很大一部分專家,減少花費;對于消費者來說,可以查詢產品的安全性,便于分辨變質食品。
在知識圖譜的構建過程中,通常需要對數據庫中的每條知識進行打標簽處理,而現有技術中,通常是由人工根據經驗對每條知識進行打標簽,為知識圖譜的構建提供數據基礎,進而可以通過索引的方式查詢到想要的食品安全知識。而人工進行打標簽的方式不僅效率低、時間周期長,而且由于每個人的主觀意識不同,對于標簽的賦予具有一定的誤判性。
因此,如何克服食品安全圖譜構建過程中人工打標簽所帶來的時間周期長、效率低以及主觀因素的誤判性缺陷,是本領域技術人員亟需解決的問題。
發明內容
有鑒于此,本發明提供了一種食品安全標準關聯知識圖譜構建方法及系統。
為了實現上述目的,本發明提供如下技術方案:
一種食品安全標準關聯知識圖譜構建方法,包括以下步驟:
步驟1、獲取食品安全標準數據源;
步驟2、對食品安全標準數據源中的結構化數據和非結構化數據進行語義識別,得到知識數據集;
步驟3、對知識數據集中的每條知識打標簽;
步驟4、依據標簽所代表的實體之間的關系,構建食品安全標準關聯知識圖譜。
可選的,食品安全標準數據源的獲取途徑包括從國家標準文件中獲取的結構化數據,以及通過網絡爬蟲從網絡中獲取的結構化數據和非結構化數據。
可選的,所述步驟2中,語義識別包括文本語義識別、圖像語義識別、語音語義識別等。
可選的,在所述步驟2中,得到知識數據集之后,需要進行數據預處理,包括數據的合并、去重等,減少后續打標簽過程的數據處理量,提高數據處理效率。
可選的,所述步驟3中對每條知識打標簽的具體方法為:
步驟3.1、對每條知識進行分詞處理;
步驟3.2、基于TF-IDF算法,計算每條知識中每個分詞所占權重;
步驟3.3、將每條知識中每個分析的權重和預設閾值進行比較,將符合閾值條件的分詞作為該條知識的標簽。
可選的,在所述步驟3.1中,對每條知識進行分詞處理的方法為:
步驟3.1.1、依據食品安全詞典或開源的詞法工具,采用正向最大匹配法、反向最大匹配法、TextRank算法中的至少一種方法,對每條知識進行分詞;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國標準化研究院,未經中國標準化研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211087778.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于全斷面巖層盾構管片背后補漿裝置
- 下一篇:一種燃料電池電堆





