[發明專利]一種基于度量學習的多示例多標記分類方法在審
| 申請號: | 201810178168.X | 申請日: | 2018-03-05 |
| 公開(公告)號: | CN108491865A | 公開(公告)日: | 2018-09-04 |
| 發明(設計)人: | 胡海峰;崔志鍇 | 申請(專利權)人: | 南京郵電大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 南京蘇科專利代理有限責任公司 32102 | 代理人: | 姚姣陽;杜春秋 |
| 地址: | 210023 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 多標記 度量 構建分類器 語義 距離度量 馬氏距離 歐氏距離 數據集中 訓練集 分類 學習 原型 參考 預測 改進 | ||
1.一種基于度量學習的多示例多標記分類方法,其特征在于,包括以下步驟:
第一步、在多示例多標記數據集中,選取一部分作為訓練集;
第二步、在訓練集中根據每個標記對應的包,得到初始的原型包;
第三步、采用多示例多標記距離度量學習構建、優化目標函數;
第四步、求包與包之間的平均豪斯多夫距離,然后根據包與包之間的平均豪斯多夫距離,得到每個包的參考近鄰和引證近鄰;
第五步、統計每個包的參考近鄰和引證近鄰中每個標記的個數,得到L維的包的標記計數向量,根據L維的包的標記計數向量構建一個L維的線性分類器;
第六步、完成對未知標記的包的預測。
2.根據權利要求1所述一種基于度量學習的多示例多標記分類方法,其特征在于,第一步中,選取的訓練集大小為多示例多標記數據集的2/3~4/5。
3.根據權利要求1所述一種基于度量學習的多示例多標記分類方法,其特征在于,第二步中,獲取初始原型包的方法如下:首先確定每個包具有哪些標記,然后根據每個標記所對應的包中示例,得到所有示例的均值,即得到初始的原型包,將初始的原型包記為Z,原型包的集合為Zl,則其中K為原型包中示例的個數,l為第l個標記。
4.根據權利要求1所述一種基于度量學習的多示例多標記分類方法,其特征在于,第三步中,采用多示例多標記距離度量學習構建、優化目標函數的具體方法如下:
3.1、基于多示例多標記距離度量學習構建目標函數,將初始化的度量學習矩陣記為A,設置初始化的度量學習矩陣A為單位矩陣;
3.2尋找、計算每個包與其相關標記的原型包的關鍵示例對,忽略非關鍵示例對;
3.3、使用交替迭代的策略,固定原型包Z,并在關鍵示例對中優化度量學習矩陣A;
3.4、固定度量學習矩陣A,優化原型包Z。
5.根據權利要求1所述一種基于度量學習的多示例多標記分類方法,其特征在于,第六步中,預測未知標記包的方法具體如下:
6.1、計算整個訓練集中包與包之間的平均豪斯多夫距離;
6.2、得到未知標記包的參考近鄰和引證近鄰;
6.3、完成對包的標記預測。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京郵電大學,未經南京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810178168.X/1.html,轉載請聲明來源鉆瓜專利網。





