[發(fā)明專(zhuān)利]一種基于雙圖正則化約束和字典學(xué)習(xí)的圖像自動(dòng)標(biāo)注方法有效
| 申請(qǐng)?zhí)枺?/td> | 202011493799.4 | 申請(qǐng)日: | 2020-12-17 |
| 公開(kāi)(公告)號(hào): | CN112487231B | 公開(kāi)(公告)日: | 2021-08-27 |
| 發(fā)明(設(shè)計(jì))人: | 王振武 | 申請(qǐng)(專(zhuān)利權(quán))人: | 中國(guó)礦業(yè)大學(xué)(北京) |
| 主分類(lèi)號(hào): | G06F16/58 | 分類(lèi)號(hào): | G06F16/58;G06F16/55 |
| 代理公司: | 北京東方盛凡知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11562 | 代理人: | 王穎 |
| 地址: | 100083 *** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 正則 約束 字典 學(xué)習(xí) 圖像 自動(dòng) 標(biāo)注 方法 | ||
本發(fā)明提供一種基于雙圖正則化約束和字典學(xué)習(xí)的圖像自動(dòng)標(biāo)注方法,包括以下步驟:根據(jù)圖像訓(xùn)練集和測(cè)試集提取圖像特征,得到圖像特征集X;采用漢明損失和高斯核函數(shù)計(jì)算圖像間相似度權(quán)重Wi,j,得到特征空間正則化圖LC;構(gòu)建初始稀疏字典D,并對(duì)圖像特征集X進(jìn)行稀疏重構(gòu)得到初始稀疏編碼A;采用凸優(yōu)化工具獲得字典原子圖LD;基于特征空間正則化圖LC約束、字典原子圖LD約束及稀疏編碼A,交替更新得到最優(yōu)稀疏字典D和分類(lèi)器W;根據(jù)最優(yōu)稀疏字典D進(jìn)行特征重構(gòu),自適應(yīng)擴(kuò)大分類(lèi)權(quán)重并利用分類(lèi)器W進(jìn)行標(biāo)簽概率預(yù)測(cè),根據(jù)標(biāo)簽預(yù)測(cè)概率進(jìn)行圖像的自動(dòng)標(biāo)注。本發(fā)明能夠有效的關(guān)聯(lián)特征之間和標(biāo)簽之間的高維聯(lián)系,具有良好的準(zhǔn)確性、泛用性和適應(yīng)性。
技術(shù)領(lǐng)域
本發(fā)明屬于圖像檢索技術(shù)領(lǐng)域,具體涉及一種基于雙圖正則化約束和字典學(xué)習(xí)的圖像自動(dòng)標(biāo)注方法。
背景技術(shù)
隨著數(shù)碼相機(jī)和電子設(shè)備的逐漸流行,各種圖像的數(shù)量正在快速增加。對(duì)于圖像檢索,用戶習(xí)慣于采用關(guān)鍵字等方式進(jìn)行檢索,但是人工的對(duì)圖像進(jìn)行標(biāo)注的方法不但工作量大,而且不可避免地帶來(lái)主觀性和不精確性,讓計(jì)算機(jī)實(shí)現(xiàn)圖像自動(dòng)標(biāo)注勢(shì)在必行。
圖像自動(dòng)標(biāo)注是讓計(jì)算機(jī)自動(dòng)地給圖像加上能夠反映其內(nèi)容的語(yǔ)義關(guān)鍵詞,自動(dòng)標(biāo)注的使用可以有效地改善目前圖像檢索的困境。
使用包含樣本原子在內(nèi)的過(guò)完備字典,樣本由過(guò)完備字典原子的稀疏線性組合表示,這是字典學(xué)習(xí)核心思想。目前研究活動(dòng)主要集中在根據(jù)給定字典分解樣本的跟蹤算法,通過(guò)從一組預(yù)先指定的線性變換中選擇一個(gè)或使字典適應(yīng)一組訓(xùn)練信號(hào),可以設(shè)計(jì)更符合上述模型的字典。這就直接指出了字典學(xué)習(xí)的兩個(gè)過(guò)程:訓(xùn)練字典和稀疏編碼。字典學(xué)習(xí)能夠有效的關(guān)聯(lián)特征與特征之間,標(biāo)簽與標(biāo)簽之間的高維聯(lián)系。
因此,提供一種基于字典學(xué)習(xí)的自動(dòng)化的圖像標(biāo)注方法是非常有必要的。
發(fā)明內(nèi)容
針對(duì)現(xiàn)有技術(shù)存在的問(wèn)題,本發(fā)明提供了一種基于雙圖正則化約束和字典學(xué)習(xí)的圖像自動(dòng)標(biāo)注方法,通過(guò)使用特征空間和字典原子空間的拉普拉斯正則化圖,通過(guò)交替迭代算法求得最優(yōu)的稀疏字典,使用最優(yōu)稀疏字典進(jìn)行特征重構(gòu),使用分類(lèi)器進(jìn)行標(biāo)簽概率預(yù)測(cè),基于標(biāo)簽預(yù)測(cè)概率構(gòu)造圖像預(yù)測(cè)標(biāo)簽集,實(shí)現(xiàn)圖像的自動(dòng)標(biāo)注,具有較強(qiáng)的準(zhǔn)確性和適用性。
為達(dá)到上述目的,本發(fā)明提出如下技術(shù)方案,本發(fā)明提供一種基于雙圖正則化約束和字典學(xué)習(xí)的圖像自動(dòng)標(biāo)注方法,包括以下步驟:
S1、構(gòu)建圖像測(cè)試集和訓(xùn)練接,根據(jù)圖像訓(xùn)練集和測(cè)試集提取圖像特征,得到圖像特征集X;
S2、采用漢明損失和高斯核函數(shù)計(jì)算圖像間相似度權(quán)重Wi,j,得到特征空間正則化圖LC;
S3、構(gòu)建初始稀疏字典D0根據(jù)初始稀疏字典D0對(duì)圖像特征集X進(jìn)行稀疏重構(gòu)得到初始稀疏編碼A;
S4、采用凸優(yōu)化工具獲得字典原子圖LD;基于特征空間正則化圖LC約束、字典原子圖LD約束及稀疏編碼A,采用交替更新并自適應(yīng)擴(kuò)大編碼權(quán)重得到最優(yōu)稀疏字典D和分類(lèi)器W;
S5、根據(jù)最優(yōu)稀疏字典D進(jìn)行特征重構(gòu),自適應(yīng)擴(kuò)大分類(lèi)權(quán)重并利用分類(lèi)器W進(jìn)行標(biāo)簽概率預(yù)測(cè),根據(jù)標(biāo)簽預(yù)測(cè)概率進(jìn)行圖像的自動(dòng)標(biāo)注。
優(yōu)選地,所述測(cè)試集和所述訓(xùn)練集分別包含若干個(gè)特征向量xi,每個(gè)特征向量xi包含若干個(gè)連續(xù)特征和離散特征。
優(yōu)選地,所述步驟S2的具體過(guò)程為:
S2.1、根據(jù)漢明損失計(jì)算圖像離散特征間相似度的權(quán)重
S2.2、根據(jù)高斯核函數(shù)計(jì)算圖像連續(xù)特征間相似度的權(quán)重
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于中國(guó)礦業(yè)大學(xué)(北京),未經(jīng)中國(guó)礦業(yè)大學(xué)(北京)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011493799.4/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 一種電子字典數(shù)據(jù)更新系統(tǒng)及其方法
- 一種階梯字典
- 一種基于網(wǎng)絡(luò)字典的無(wú)損數(shù)據(jù)壓縮方法
- 數(shù)據(jù)冗余消除DRE字典確認(rèn)方法和設(shè)備
- 一種對(duì)字典和字典項(xiàng)進(jìn)行處理的方法及服務(wù)器
- 一種數(shù)據(jù)字典的處理方法、裝置、存儲(chǔ)介質(zhì)及處理器
- 一種基于深度矩陣字典的字典學(xué)習(xí)方法
- 一種字典轉(zhuǎn)碼方法、裝置、存儲(chǔ)介質(zhì)及終端
- 一種基于不相干性聯(lián)合字典學(xué)習(xí)的圖像分類(lèi)方法
- 一種基于Kubernetes容器配置字典和保密字典的實(shí)現(xiàn)方法及其系統(tǒng)





