[發明專利]一種標準要素的一致性檢驗方法有效
| 申請號: | 202011386161.0 | 申請日: | 2020-12-02 |
| 公開(公告)號: | CN112395854B | 公開(公告)日: | 2022-11-22 |
| 發明(設計)人: | 王雙;高昂;程越;朱虹;萬利;李柏晨 | 申請(專利權)人: | 中國標準化研究院 |
| 主分類號: | G06F40/205 | 分類號: | G06F40/205;G06F40/126;G06F40/284;G06F40/30;G06F16/31;G06K9/62;G06N5/02 |
| 代理公司: | 北京科慧致遠知識產權代理有限公司 11739 | 代理人: | 李瑞 |
| 地址: | 100191*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 標準 要素 一致性 檢驗 方法 | ||
本申請提供了一種針對標準要素的一致性檢驗方法,首先,基于規則進行標準知識元提取,將非結構化的標準文件轉化為規則的知識元存儲模型,抽取其中的術語、規范性引用文件以及編碼表,將其進行向量化處理。進而,對標準中術語、規范性引用文件的一致性進行檢驗,確保標準間術語、規范性引用文件的規范性和協調一致性。特別的,針對信息分類編碼這類重要的基礎通用性標準,通過編碼的一致性檢驗,減少由于信息分類編碼標準新版本實施帶來的數據庫遷移工作中的人工干預,提高工作效率。進一步地,還可以將知識元模型作為神經網絡輸入層的神經元,用標準文件數據集來訓練神經網絡,更高效地實現海量文件數據的處理。
技術領域
本申請涉及用于標準中要素的一致性檢驗方法。
背景技術
標準是指“為了在一定的范圍內獲得最佳秩序,經協商一致制定并由公認機構批準,共同使用和重復使用的一種規范性文件”。標準具有嚴格的結構,由規范性要素和資料性要素組成,其中,規范性要素包括名稱、范圍、規范性引用文件、術語和定義、代號和縮略語、規范性附錄等;資料性附錄包括封面、目次、前言、引言、資料性附錄、參考文獻、索引等。規范性要素是標準的核心部分,盡管一個標準中并不需要包括所有的規范性要素,但是在編寫規范性要素的時候,必須要保證規范性要素的正確性、與其他標準的一致性程度,如術語的一致性程度、規范性引用文件的一致性程度,這些一致性程度決定了不同標準、以及標準不同版本之間的協調一致性。特別的,針對信息分類編碼標準這類重要的基礎通用性標準,編碼之間的一致性檢驗,對于信息系統數據庫的遷移和數據庫之間的信息交換具有重要的意義。當前,標準文件的管理主要還是停留在數據管理層面,眾多的標準文件管理平臺(如國際標準化組織(ISO)、國際電工委員會(IEC)等國際標準文件檢索平臺,國家標準全文公開系統、全國標準信息公共服務平臺、國家標準文件共享服務平臺、標準搜等國內的標準文件管理平臺)提供的主要是標準數據的檢索、分發服務,缺乏對標準文件的細粒度數據分析,因此,對于標準之間可能出現的交叉、重復或者不一致的現象缺乏有效的檢驗手段,為標準的編制和實施帶來了一定的影響。
針對上述技術問題,本申請提供了一種針對標準要素的一致性檢驗方法,首先,基于規則進行標準知識元提取,將非結構化的標準文件轉化為規則的知識元存儲模型,抽取其中的術語、規范性引用文件以及編碼表,將其進行向量化處理。進而,對標準中術語、規范性引用文件的一致性進行檢驗,確保標準間術語、規范性引用文件的規范性和協調一致性。特別的,針對信息分類編碼這類重要的基礎通用性標準,通過編碼的一致性檢驗,減少由于信息分類編碼標準新版本實施帶來的數據庫遷移工作中的人工干預,提高工作效率。進一步地,還可以將知識元模型作為神經網絡輸入層的神經元,用標準文件數據集來訓練神經網絡,更高效地實現海量文件數據的處理。
發明內容
本發明的目的在于通過對標準中術語、規范性引用文件、以及分類編碼的一致性檢驗,確保標準間術語、規范性引用文件的規范性和協調一致性,同時,實現編碼之間一對一、一對多、多對一以及模糊對應等關系的自動映射,減少由于信息分類編碼標準新版本實施帶來的數據庫遷移工作中的人工干預,提高工作效率。
為了達到上述目的,本申請提供一種針對標準要素的一致性檢驗方法,包括:(1)基于規則對標準知識元進行提取,將標準文件轉化為知識元存儲模型;(2)建立術語、規范性引用文件、編碼表的向量存儲模型,對其進行規范化存儲;(3)針對術語的一致性檢驗步驟包括,首先對術語進行檢索,得到包含同名或相似術語的術語集合;進一步基于術語向量模型實現對同名術語的一致性檢驗,以及相似術語的相似度計算;(4)針對規范性引用文件的一致性檢驗步驟包括,首先對規范性引用文件檢索,得到包含該引用文件的所有標準條款集合。根據注日期引用和不注日期引用,以及是否引用具體條款組合條件進行判斷,對標準內容與規范性引用文件中的相應條款或全文進行一致性比對。
其中,知識元是相互獨立的,能夠對知識進行表征的單元。
特別的,本申請還針對信息分類編碼標準的新舊版本之間進行編碼比對分析。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國標準化研究院,未經中國標準化研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011386161.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種輸電線路舞動監測系統及方法
- 下一篇:一種汽車充電裝置





