[發(fā)明專利]一種基于非對稱條件依賴的多標(biāo)簽主動(dòng)學(xué)習(xí)方法在審
| 申請?zhí)枺?/td> | 201710271412.2 | 申請日: | 2017-04-24 |
| 公開(公告)號: | CN107423749A | 公開(公告)日: | 2017-12-01 |
| 發(fā)明(設(shè)計(jì))人: | 吳健;張宇;徐在俊 | 申請(專利權(quán))人: | 蘇州融希信息科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司11227 | 代理人: | 羅滿 |
| 地址: | 215000 江蘇省蘇州市工業(yè)園*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 對稱 條件 依賴 標(biāo)簽 主動(dòng) 學(xué)習(xí)方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及多標(biāo)簽主動(dòng)學(xué)習(xí)技術(shù)領(lǐng)域,特別是涉及一種基于非對稱條件依賴的多標(biāo)簽主動(dòng)學(xué)習(xí)方法。
背景技術(shù)
隨著計(jì)算機(jī)的快速發(fā)展,多標(biāo)簽圖像分類的研究已經(jīng)成為相關(guān)領(lǐng)域研究的熱點(diǎn),在學(xué)術(shù)界和企業(yè)界受到越來越多的關(guān)注。多標(biāo)簽主動(dòng)學(xué)習(xí)方法的作用是處理多標(biāo)簽圖像的分類問題,即通過學(xué)習(xí)得到一個(gè)分類器,該分類器能夠根據(jù)圖像的內(nèi)容為圖像分配多個(gè)相關(guān)的標(biāo)簽。
目前,多標(biāo)簽主動(dòng)學(xué)習(xí)領(lǐng)域的研究的主流是針對基于“樣本-標(biāo)簽對”的多標(biāo)簽主動(dòng)學(xué)習(xí)方法的研究。因?yàn)橄啾容^基于“樣本”的多標(biāo)簽主動(dòng)學(xué)習(xí)方法,基于“樣本-標(biāo)簽對”的多標(biāo)簽主動(dòng)學(xué)習(xí)方法不僅能更大程度上提升主動(dòng)學(xué)習(xí)效率,降低訓(xùn)練集空間的樣本冗余,也能最大程度上降低人工標(biāo)記的代價(jià),因此基于“樣本-標(biāo)簽對”的多標(biāo)簽主動(dòng)學(xué)習(xí)方法逐漸成為研究的熱點(diǎn)之一。
訓(xùn)練樣本中標(biāo)簽間依賴關(guān)系在很大程度上影響著多標(biāo)簽主動(dòng)學(xué)習(xí)的采樣策略,進(jìn)而影響主動(dòng)學(xué)習(xí)結(jié)果。目前,關(guān)于標(biāo)簽間依賴關(guān)系的研究大致可以分成兩類:條件依賴關(guān)系和非條件依賴關(guān)系。所有的依賴關(guān)系都是用于標(biāo)識標(biāo)簽間是否存在關(guān)系,以及存在這種關(guān)系的相關(guān)程度。然而,在現(xiàn)實(shí)生活中,標(biāo)簽間的依賴關(guān)系往往不是僅僅的相關(guān)或者不相關(guān)關(guān)系,一種比較常見的標(biāo)簽關(guān)系有從屬關(guān)系或樹狀關(guān)系。由此可見,標(biāo)簽間的依賴關(guān)系往往具有不對稱性,而不僅僅是所謂的相關(guān)關(guān)系或不相關(guān)關(guān)系。
因此,如何挖掘這種非對稱的條件依賴關(guān)系,以及將其用于指導(dǎo)主動(dòng)學(xué)習(xí)過程,是一個(gè)十分值得研究的問題。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種基于非對稱條件依賴的多標(biāo)簽主動(dòng)學(xué)習(xí)方法,用于利用標(biāo)簽間的非對稱條件依賴關(guān)系指導(dǎo)半監(jiān)督主動(dòng)學(xué)習(xí)的采樣過程。
為解決上述技術(shù)問題,本發(fā)明提供一種基于非對稱條件依賴的多標(biāo)簽主動(dòng)學(xué)習(xí)方法,包括:
獲取原始樣本對應(yīng)的標(biāo)簽集合,計(jì)算所述標(biāo)簽集合中各標(biāo)簽與其余標(biāo)簽的非對稱條件依賴關(guān)系以得到所述標(biāo)簽集合對應(yīng)的非對稱條件依賴矩陣;
對所述非對稱條件依賴矩陣歸一化處理得到對應(yīng)的權(quán)重矩陣;
通過所述權(quán)重矩陣上的各元素計(jì)算各樣本-標(biāo)簽對的信息量;
篩選出信息量最大的樣本-標(biāo)簽對作為預(yù)先建立的半監(jiān)督主動(dòng)學(xué)習(xí)模型的輸入對象,并進(jìn)行主動(dòng)學(xué)習(xí)。
優(yōu)選地,所述計(jì)算所述標(biāo)簽集合中各標(biāo)簽與其余標(biāo)簽的非對稱條件依賴關(guān)系以得到所述標(biāo)簽集合對應(yīng)的非對稱條件依賴矩陣具體包括:
在所述標(biāo)簽集合中按照預(yù)處理規(guī)則篩選出存在依賴關(guān)系的各對標(biāo)簽;
分別為各對標(biāo)簽構(gòu)建多個(gè)基于概率分布的二類分類器模型;
在所述標(biāo)簽集合上進(jìn)行k次交叉驗(yàn)證,分別獲取各所述二類分類器模型與對應(yīng)的標(biāo)簽的k次平均分類準(zhǔn)確率;
按照T-檢驗(yàn)計(jì)算各標(biāo)簽得到的所述k次分均分類準(zhǔn)確率的T-檢驗(yàn)值以作為所述依賴結(jié)果將各所述依賴結(jié)果組成所述非對稱條件依賴矩陣。
優(yōu)選地,所述二類分類器模型的數(shù)量為四個(gè)。
優(yōu)選地,所述權(quán)重矩陣具體通過計(jì)算所述非對稱條件依賴矩陣中各標(biāo)簽與其余標(biāo)簽的影響權(quán)重得到;
其中,任意標(biāo)簽與自身標(biāo)簽的影響權(quán)重為1。
優(yōu)選地,所述信息量具體通過所述權(quán)重矩陣上的交叉標(biāo)簽的不確定性得到。
本發(fā)明所提供的基于非對稱條件依賴標(biāo)簽集的多標(biāo)簽主動(dòng)學(xué)習(xí)方法,首先挖掘出弱標(biāo)記條件下的各標(biāo)簽與其余標(biāo)簽的非對稱條件依賴關(guān)系以得到非對稱條件依賴矩陣,并在非對稱條件依賴標(biāo)簽集的基礎(chǔ)上,計(jì)算各樣本-標(biāo)簽對的信息量,最后篩選出信息量最大的樣本-標(biāo)簽對作為半監(jiān)督主動(dòng)學(xué)習(xí)模型的輸入對象。通過實(shí)驗(yàn)表明,利用非對稱條件依賴標(biāo)簽集進(jìn)行主動(dòng)學(xué)習(xí)的方法相對于其他弱標(biāo)記條件下挖掘標(biāo)簽間關(guān)系的方法具有良好的泛化性能。
附圖說明
為了更清楚地說明本發(fā)明實(shí)施例,下面將對實(shí)施例中所需要使用的附圖做簡單的介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明實(shí)施例提供的一種基于非對稱條件依賴的多標(biāo)簽主動(dòng)學(xué)習(xí)方法的流程圖;
圖2為本發(fā)明實(shí)施例提供的一種標(biāo)簽間的層次標(biāo)簽關(guān)系的示意圖;
圖3為本發(fā)明實(shí)施例提供的另一種標(biāo)簽間的層次標(biāo)簽關(guān)系的示意圖;
圖4為本發(fā)明實(shí)施例提供的一種標(biāo)簽間的從屬標(biāo)簽關(guān)系的示意圖;
圖5為本發(fā)明實(shí)施例提供的一種弱標(biāo)記條件下的各對標(biāo)簽的非對稱條件依賴關(guān)系的挖掘示意圖;
圖6為本發(fā)明實(shí)施提供的一種先驗(yàn)標(biāo)簽集的示意圖;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于蘇州融希信息科技有限公司,未經(jīng)蘇州融希信息科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710271412.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 限制條件解決方法、限制條件解決裝置、以及限制條件解決系統(tǒng)
- 制造條件設(shè)定系統(tǒng)及制造條件設(shè)定方法
- 成形條件確定方法及成形條件確定系統(tǒng)
- 成形條件設(shè)定裝置、成形條件設(shè)定方法及成形條件設(shè)定畫面
- 攝影條件設(shè)定設(shè)備、攝影條件設(shè)定方法和攝影條件設(shè)定程序
- 生理?xiàng)l件監(jiān)視系統(tǒng)、生理?xiàng)l件傳感器和生理?xiàng)l件儀表
- 成形條件設(shè)定裝置、成形條件設(shè)定方法及成形條件設(shè)定畫面
- 條件訪問設(shè)備
- 用于條件切換的裝置、方法、介質(zhì)和系統(tǒng)
- 基于條件分布的條件生成對抗網(wǎng)絡(luò)





