[發(fā)明專(zhuān)利]一種基于條件依賴(lài)標(biāo)簽集的多標(biāo)簽主動(dòng)學(xué)習(xí)方法在審
| 申請(qǐng)?zhí)枺?/td> | 201710271035.2 | 申請(qǐng)日: | 2017-04-24 |
| 公開(kāi)(公告)號(hào): | CN107092932A | 公開(kāi)(公告)日: | 2017-08-25 |
| 發(fā)明(設(shè)計(jì))人: | 吳健;張宇;徐在俊 | 申請(qǐng)(專(zhuān)利權(quán))人: | 蘇州融希信息科技有限公司 |
| 主分類(lèi)號(hào): | G06K9/62 | 分類(lèi)號(hào): | G06K9/62 |
| 代理公司: | 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司11227 | 代理人: | 羅滿(mǎn) |
| 地址: | 215000 江蘇省蘇州市工業(yè)園*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 條件 依賴(lài) 標(biāo)簽 主動(dòng) 學(xué)習(xí)方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及多標(biāo)簽主動(dòng)學(xué)習(xí)技術(shù)領(lǐng)域,特別是涉及一種基于條件依賴(lài)標(biāo)簽集的多標(biāo)簽主動(dòng)學(xué)習(xí)方法。
背景技術(shù)
隨著計(jì)算機(jī)的快速發(fā)展,多標(biāo)簽圖像分類(lèi)的研究已經(jīng)成為相關(guān)領(lǐng)域研究的熱點(diǎn),在學(xué)術(shù)界和企業(yè)界受到越來(lái)越多的關(guān)注。多標(biāo)簽主動(dòng)學(xué)習(xí)方法的作用是處理多標(biāo)簽圖像的分類(lèi)問(wèn)題,即通過(guò)學(xué)習(xí)得到一個(gè)分類(lèi)器,該分類(lèi)器能夠根據(jù)圖像的內(nèi)容為圖像分配多個(gè)相關(guān)的標(biāo)簽。
目前,多標(biāo)簽主動(dòng)學(xué)習(xí)領(lǐng)域的研究主流是針對(duì)基于“樣本-標(biāo)簽對(duì)”的多標(biāo)簽主動(dòng)學(xué)習(xí)方法的研究。因?yàn)橄啾容^基于“樣本”的多標(biāo)簽主動(dòng)學(xué)習(xí)方法,基于“樣本-標(biāo)簽對(duì)”的多標(biāo)簽主動(dòng)學(xué)習(xí)方法不僅能更大程度上提升主動(dòng)學(xué)習(xí)效率,降低訓(xùn)練集空間的樣本冗余,也能最大程度上降低人工標(biāo)記的代價(jià),因此基于“樣本-標(biāo)簽對(duì)”的多標(biāo)簽主動(dòng)學(xué)習(xí)方法逐漸成為研究的熱點(diǎn)之一。
但是,所有的基于“樣本-標(biāo)簽對(duì)”的多標(biāo)簽主動(dòng)學(xué)習(xí)方法都不可避免地面臨著“弱標(biāo)記”問(wèn)題和標(biāo)簽間依賴(lài)關(guān)系丟失問(wèn)題,即隨著主動(dòng)學(xué)習(xí)過(guò)程的不斷迭代,訓(xùn)練樣本中存在著大量不完全標(biāo)記的樣本,而這些不完全標(biāo)記的樣本,從一定程度上對(duì)標(biāo)簽關(guān)系的挖掘存在著重要的影響。而已有研究表明標(biāo)簽關(guān)系在很大程度上影響著多標(biāo)簽主動(dòng)學(xué)習(xí)的采樣策略,進(jìn)而影響主動(dòng)學(xué)習(xí)結(jié)果。
因此,如何解決基于“樣本-標(biāo)簽對(duì)”的多標(biāo)簽主動(dòng)學(xué)習(xí)方法過(guò)程中遇到的樣本“弱標(biāo)記”問(wèn)題,或者如何在“弱標(biāo)記”條件下挖掘并利用標(biāo)簽關(guān)系是本領(lǐng)域技術(shù)人員亟待解決的問(wèn)題。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種基于條件依賴(lài)標(biāo)簽集的多標(biāo)簽主動(dòng)學(xué)習(xí)方法,用于解決基于“樣本-標(biāo)簽對(duì)”的多標(biāo)簽主動(dòng)學(xué)習(xí)方法過(guò)程中遇到的樣本“弱標(biāo)記”問(wèn)題,或者在“弱標(biāo)記”條件下挖掘并利用標(biāo)簽關(guān)系以進(jìn)行主動(dòng)學(xué)習(xí)。
為解決上述技術(shù)問(wèn)題,本發(fā)明提供一種基于條件依賴(lài)標(biāo)簽集的多標(biāo)簽主動(dòng)學(xué)習(xí)方法,包括:
獲取原始樣本對(duì)應(yīng)的標(biāo)簽集合,計(jì)算所述標(biāo)簽集合中各標(biāo)簽與其余標(biāo)簽的依賴(lài)結(jié)果以得到各標(biāo)簽對(duì)應(yīng)的條件依賴(lài)標(biāo)簽集;
計(jì)算各樣本-標(biāo)簽對(duì)對(duì)應(yīng)的信息熵,并利用所述條件依賴(lài)標(biāo)簽集計(jì)算各樣本-標(biāo)簽對(duì)的相對(duì)熵;
整合各所述信息熵和各所述相對(duì)熵得到對(duì)應(yīng)的各樣本-標(biāo)簽對(duì)的信息量;
篩選出信息量最大的樣本-標(biāo)簽對(duì)作為預(yù)先建立的主動(dòng)學(xué)習(xí)模型的輸入對(duì)象,并進(jìn)行主動(dòng)學(xué)習(xí)。
優(yōu)選地,所述計(jì)算所述標(biāo)簽集合中各標(biāo)簽與其余標(biāo)簽的依賴(lài)結(jié)果以得到各標(biāo)簽對(duì)應(yīng)的條件依賴(lài)標(biāo)簽集具體包括:
在所述標(biāo)簽集合中按照預(yù)處理規(guī)則篩選出存在依賴(lài)關(guān)系的各對(duì)標(biāo)簽;
分別為各對(duì)標(biāo)簽構(gòu)建多個(gè)基于概率分布的二類(lèi)分類(lèi)器模型;
在所述標(biāo)簽集合上進(jìn)行k次交叉驗(yàn)證,分別獲取各所述二類(lèi)分類(lèi)器模型與對(duì)應(yīng)的標(biāo)簽的k次平均分類(lèi)準(zhǔn)確率;
按照T-檢驗(yàn)計(jì)算各標(biāo)簽得到的所述k次分均分類(lèi)準(zhǔn)確率的T-檢驗(yàn)值,并將各標(biāo)簽間的最大的T-檢驗(yàn)值作為所述依賴(lài)結(jié)果;
其中,若所述依賴(lài)結(jié)果大于0,則當(dāng)前兩個(gè)標(biāo)簽存在條件依賴(lài)關(guān)系。
優(yōu)選地,所述二類(lèi)分類(lèi)器模型的數(shù)量為四個(gè)。
優(yōu)選地,所述信息熵具體通過(guò)當(dāng)前分類(lèi)器模型對(duì)當(dāng)前樣本-標(biāo)簽對(duì)的預(yù)測(cè)概率值得到。
優(yōu)選地,所述相對(duì)熵具體通過(guò)KL散度方式得到。
本發(fā)明所提供的基于條件依賴(lài)標(biāo)簽集的多標(biāo)簽主動(dòng)學(xué)習(xí)方法,首先挖掘出弱標(biāo)記條件下的各標(biāo)簽的條件依賴(lài)標(biāo)簽集,并在條件依賴(lài)標(biāo)簽集的基礎(chǔ)上,計(jì)算各樣本-標(biāo)簽對(duì)的信息熵和相對(duì)熵,然后整合信息熵和相對(duì)熵之后得到對(duì)應(yīng)的各樣本-標(biāo)簽對(duì)的信息量,最后篩選出信息量最大的樣本-標(biāo)簽對(duì)作為主動(dòng)學(xué)習(xí)模型的輸入對(duì)象。通過(guò)實(shí)驗(yàn)表明,該主動(dòng)學(xué)習(xí)方法相對(duì)于其他弱標(biāo)記條件下挖掘標(biāo)簽間關(guān)系的方法具有良好的泛化性能。
附圖說(shuō)明
為了更清楚地說(shuō)明本發(fā)明實(shí)施例,下面將對(duì)實(shí)施例中所需要使用的附圖做簡(jiǎn)單的介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明實(shí)施例提供的一種基于條件依賴(lài)標(biāo)簽集的多標(biāo)簽主動(dòng)學(xué)習(xí)方法的流程圖;
圖2為本發(fā)明實(shí)施例提供的一種弱標(biāo)記條件下的各對(duì)標(biāo)簽的條件依賴(lài)關(guān)系的挖掘示意圖;
圖3為本發(fā)明實(shí)施例提供的在數(shù)據(jù)集flags上的Accuracy的對(duì)比圖;
圖4為本發(fā)明實(shí)施例提供的在數(shù)據(jù)集scene上的Accuracy的對(duì)比圖;
圖5為本發(fā)明實(shí)施例提供的在數(shù)據(jù)集NUS_WIDE上的Accuracy的對(duì)比圖;
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于蘇州融希信息科技有限公司,未經(jīng)蘇州融希信息科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710271035.2/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 限制條件解決方法、限制條件解決裝置、以及限制條件解決系統(tǒng)
- 制造條件設(shè)定系統(tǒng)及制造條件設(shè)定方法
- 成形條件確定方法及成形條件確定系統(tǒng)
- 成形條件設(shè)定裝置、成形條件設(shè)定方法及成形條件設(shè)定畫(huà)面
- 攝影條件設(shè)定設(shè)備、攝影條件設(shè)定方法和攝影條件設(shè)定程序
- 生理?xiàng)l件監(jiān)視系統(tǒng)、生理?xiàng)l件傳感器和生理?xiàng)l件儀表
- 成形條件設(shè)定裝置、成形條件設(shè)定方法及成形條件設(shè)定畫(huà)面
- 條件訪問(wèn)設(shè)備
- 用于條件切換的裝置、方法、介質(zhì)和系統(tǒng)
- 基于條件分布的條件生成對(duì)抗網(wǎng)絡(luò)
- 治療依賴(lài)戒斷
- 基于依賴(lài)的軟件包依賴(lài)關(guān)系檢查方法
- 數(shù)據(jù)依賴(lài)解析輔助裝置、數(shù)據(jù)依賴(lài)解析輔助程序以及數(shù)據(jù)依賴(lài)解析輔助方法
- 相關(guān)數(shù)據(jù)依賴(lài)
- 依賴(lài)圖中的時(shí)間依賴(lài)性
- 更新依賴(lài)服務(wù)
- 孕婦枕(依賴(lài))
- 依賴(lài)圖中的時(shí)間依賴(lài)性
- 鏡像構(gòu)建方法與裝置、電子設(shè)備、存儲(chǔ)介質(zhì)
- 一種應(yīng)用程序容量監(jiān)控方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 瀏覽器中關(guān)閉標(biāo)簽的裝置和方法
- 標(biāo)簽生成方法及標(biāo)簽生成裝置
- 一種帶有標(biāo)簽的電氣插座
- 標(biāo)簽檢測(cè)定位裝置及其標(biāo)簽制造設(shè)備
- 標(biāo)簽切割裝置及其標(biāo)簽加工機(jī)
- 基于樹(shù)形結(jié)構(gòu)的標(biāo)簽存儲(chǔ)方法及裝置
- 一種標(biāo)簽分離機(jī)構(gòu)
- 標(biāo)簽切割裝置及其標(biāo)簽加工機(jī)
- 標(biāo)簽檢測(cè)定位裝置及其標(biāo)簽制造設(shè)備
- 標(biāo)簽轉(zhuǎn)換處理方法、裝置、電子設(shè)備及可讀存儲(chǔ)介質(zhì)





