[發明專利]一種基于屬性加權計算檢測機構相似度的方法在審
| 申請號: | 201410074495.2 | 申請日: | 2014-03-03 |
| 公開(公告)號: | CN103823880A | 公開(公告)日: | 2014-05-28 |
| 發明(設計)人: | 張濤;李向前;袁松宏;陳國東;周佳;徐薇;張冰 | 申請(專利權)人: | 國家認證認可監督管理委員會信息中心 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京金智普華知識產權代理有限公司 11401 | 代理人: | 巴曉艷 |
| 地址: | 100020 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 屬性 加權 計算 檢測 機構 相似 方法 | ||
技術領域:
???本發明屬于信息處理領域,具體涉及計算檢測機構的相似度,特別是一種基于屬性加權計算檢測機構相似度的方法。
?
背景技術:
????相似性在人類認知世界的過程中具有重要作用。現代社會已進入信息化時代,產生了大量的數據,如何來定義數據之間的相似性是機器學習、數據挖掘、模式識別等領域所面臨的主要問題之一。
????檢測機構是指通過國家認證認可監督管理委員會或地方認證認可監督管理部門資質認定、或通過中國合格評定國家認可委員會認可的向社會出具具有證明作用的數據和結果的實驗室和檢查機構。然而,目前存在檢測機構一家機構多塊牌子的情況,這種“一個戶頭多個戶名”的情況,不利于管理部門全面地掌握檢測市場的準確信息,不利于信息公開,同時也不利于檢測結果國際間的互認。基于這種情況,建立統一的檢測機構數據庫進行管理,就顯得尤為必要。
對相似性的研究可分為兩大類:基于監督學習和基于無監督學習。基于監督學習的相似性度量利用了數據的相似性標簽,通過對樣本集的學習,對已有數據的相似性模型進行提取,然后用得到的模型去度量新的數據對象之間的相似性。典型的監督學習算法有支持向量機(SVM)、人工神經網絡(ANN)等。由于表示檢測機構的數據的特殊性,監督學習條件下的相似性度量方法并不適用。因此,我們提出了無監督條件下基于屬性加權的檢測機構相似性度量方法,運用層次分析法,將先驗知識融入相似性計算模型,以有效的區分不同機構。
基于無監督學習的相似性需要自行定義。Tversky用離散屬性集合來表示對象,兩個對象之間的相似性依賴于兩個對象共有屬性與特異屬性的數量。用這樣的方法計算相似性稱為屬性相似性計算模型。
檢測機構由其屬性法人、地域、主管單位、資質、人員來描述,因此,我們采用基于屬性的相似性度量方法。當不同的檢測機構共有的屬性多時,它們之間具有較強的相似性;反之相似性較弱。
對象的每個屬性都具有一個可能的值域。根據屬性域的組織,我們可以區分三種基本屬性類型:符號的(離散的、標稱的、分類的)、連續的(數值的)和結構化的。對于檢測機構來說,法人、地域、主管單位是符號型的屬性,資質和人員是結構化型的屬性。
一般意義上的屬性相似性計算模型基于兩個對象共有屬性的個數,這默認了兩點:
1)對象的屬性對比結果是布爾型的,即兩個對象共有或非共有某屬性;
2)所有屬性對相似性度量的貢獻程度相同。
但在有些情況下并不適用。例如,某些屬性的對比結果本身就是一種相似性,考慮兩個對象A和B,它們共有屬性t,而t是由多值組成的集合。A和B在屬性t上的相似性,就不能簡單的認為是布爾型,因為二者的屬性t所對應的集合可能共有部分元素;再比如,考慮描述動物的兩個屬性:體重和是否會游泳,顯然后者對于相似性度量的貢獻程度要大于前者。
?
發明內容:
在本發明中提出了基于屬性加權的檢測機構相似性度量方法,對屬性的相似性進行了推廣,并考慮了屬性的權重對于相似性度量貢獻程度的不同,以有效的區分不同機構。
本發明提供一種基于屬性加權計算檢測結構相似度的方法,所述檢測對象包括多個屬性,其特征在于,所述方法利用層次分析法計算檢測對象屬性的權重,然后計算各個對應屬性間的相似度,最后加權求和得到兩家檢測結構之間的相似度;
進一步地,所述方法包括以下步驟:
1)根據檢測機構的5個屬性建立樹狀數據結構模型:
2)計算上述數據模型結構中屬性相似度;
3)?計算檢測機構的全局相似度;
4)?通過設置相似度閾值來判斷檢測機構的相似性;
???進一步地,所述步驟1)中的屬性包括法人、主管單位、地域、資質、人員。
本發明的有益效果是:通過對檢測機構進行相似性度量,去除重復冗余的機構,可以建立統一的檢測機構數據庫進行管理。
?
附圖說明:
圖1為本發明檢測機構的模型建立;
圖2為本發明基于屬性加權的檢測機構相似性度量方法的流程圖;
圖3為本發明檢測機構層次結構模型。
?
具體實施方式:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國家認證認可監督管理委員會信息中心,未經國家認證認可監督管理委員會信息中心許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410074495.2/2.html,轉載請聲明來源鉆瓜專利網。





