[發明專利]一種基于PageRank和互信息的多標簽分類器鏈圖像識別方法在審
| 申請號: | 202211675671.9 | 申請日: | 2022-12-26 |
| 公開(公告)號: | CN115965834A | 公開(公告)日: | 2023-04-14 |
| 發明(設計)人: | 丁家滿;胡爽;賈連印;付曉東;姜瑛 | 申請(專利權)人: | 昆明理工大學 |
| 主分類號: | G06V10/774 | 分類號: | G06V10/774;G06V10/764 |
| 代理公司: | 昆明明潤知識產權代理事務所(普通合伙) 53215 | 代理人: | 王鵬飛 |
| 地址: | 650093 云*** | 國省代碼: | 云南;53 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 pagerank 互信 標簽 分類 圖像 識別 方法 | ||
本發明涉及一種基于PageRank和互信息的多標簽分類器鏈圖像識別方法,屬于數據挖掘中多標簽分類技術領域。本發明首先利用互信息來計算標簽與標簽之間和標簽與特征之間的相關性,然后,將特征類比成網頁,用標簽的相關關系代替網頁的鏈接關系,最后,借助PageRank算法中按照網頁被訪問概率給網頁排序的思想生成標簽訓練順序,生成分類器鏈,從而對圖像進行識別。本發明解決了充分考慮標簽相關性,尋求合適標簽順序從而得到更好的圖像分類性能。
技術領域
本發明涉及一種基于PageRank和互信息的多標簽分類器鏈圖像識別方法,屬于數據挖掘中多標簽分類技術領域。
背景技術
現實世界中的對象往往是復雜的并且同時具有多個語義,因此,為了解決實際問題,近些年來,多標簽分類的需求日益增長,并且已經專門設計并成功使用了許多機器學習技術,包括文本分類、語義圖像注釋、生物信息學分析以及醫療診斷等諸多領域。
分類器鏈方法及其變型是利用標簽關系方面的一類有效技術,它將標簽按照某種次序排成鏈,然后依次對鏈上的標簽構建分類器。其中,鏈后面的標簽可利用鏈前面標簽所學習到的分類結果。雖然分類器鏈算法實現簡單,但已在很多文獻的實驗報道中指出,分類器鏈算法利用標簽關系取得了比不用標簽關系的方法更好的性能。
發明內容
本發明要解決的技術問題是提供了一種基于PageRank和互信息的多標簽分類器鏈圖像識別方法,以用于解決以往的分類器鏈算法中預測順序的隨機性、忽略特征與標簽的依賴的問題,避免標簽組合爆炸。
本發明的技術方案是:一種基于PageRank和互信息的多標簽分類器鏈圖像識別方法,其首先利用互信息來計算標簽與標簽之間和標簽與特征之間的相關性,然后,將特征類比成網頁,用標簽的相關關系代替網頁的鏈接關系,最后,借助PageRank算法中按照網頁被訪問概率給網頁排序的思想生成標簽訓練順序,生成分類器鏈,從而對圖像進行識別。
具體步驟為:
互聯網中的網絡節點結構復雜,且相互鏈接,可以看作一個復雜網絡,鏈接分析通過網頁之間的相關性進行排序。而在多標簽分類問題中,標簽數目巨大,標簽與標簽之間也存在著一定的相關性,因此也可以視作一個復雜網絡模型。本發明將標簽與網頁進行類比,通過鏈接分析的思想,來對標簽進行排序。
將標簽與網頁類比,生成標簽相似網絡,將標簽視為網頁,網頁之間存在鏈接關系,而標簽之間存在相似關系.將標簽視為網頁,則標簽的相似視為網頁的鏈接,網頁之間的鏈接關系被視為標簽之間的相關關系,網頁的出入鏈視為標簽之間的相似鏈,每個網頁的出入鏈數量等于標簽與其他與之相似的標簽之間的相似鏈數量,將分類器鏈的標簽排序問題,轉化為網頁排序問題。
Step1:測量不同標簽之間的相關性,計算任意兩個類別之間的互信息,并將二進制互信息組合成標簽集的總體度量。
計算標簽之間和標簽與特征之間的互信息,存入相關性矩陣MI給出兩個標簽li和lj,這兩個類之間的相互信息可以定義為:
其中,P(li,lj)是聯合概率,P(li)和P(lj)分別是li和lj的邊際概率。
標簽相似度的計算分為兩個步驟,分別處理標簽之間的相似度計算和標簽與特征之間的相似度計算。
Step2:得到標簽相似度矩陣之后,根據標簽之間的相似關系,構造標簽相似網絡,從而計算標簽重要度,得到標簽重要度排序,即可得到標簽順序,從而生成分類器鏈.
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于昆明理工大學,未經昆明理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211675671.9/2.html,轉載請聲明來源鉆瓜專利網。





