[發(fā)明專利]基于自適應(yīng)代價敏感特征學習的不平衡隱寫分析方法有效
| 申請?zhí)枺?/td> | 202010217273.7 | 申請日: | 2020-03-25 |
| 公開(公告)號: | CN111415289B | 公開(公告)日: | 2022-04-01 |
| 發(fā)明(設(shè)計)人: | 王麗娜;嘉炬;翟黎明;任魏翔 | 申請(專利權(quán))人: | 武漢大學 |
| 主分類號: | G06T1/00 | 分類號: | G06T1/00;G06K9/62;G06V10/774;G06V10/764 |
| 代理公司: | 武漢科皓知識產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 42222 | 代理人: | 王琪 |
| 地址: | 430072 湖*** | 國省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 自適應(yīng) 代價 敏感 特征 學習 不平衡 分析 方法 | ||
1.基于自適應(yīng)代價敏感特征學習的不平衡隱寫分析方法,其特征在于,包括如下步驟:
步驟1,構(gòu)建具有不同不平衡率的訓(xùn)練樣本集;
步驟2,對訓(xùn)練樣本集進行預(yù)處理,學習所有樣本的最優(yōu)重構(gòu)系數(shù)矩陣Z*;
步驟3,計算最優(yōu)重構(gòu)系數(shù)矩陣Z*每列的非零系數(shù)個數(shù),得到每個訓(xùn)練樣本的最優(yōu)k值;
步驟4,確定每個樣本的最優(yōu)k值后,基于最近鄰算法得到訓(xùn)練樣本的類內(nèi)代價;
步驟5,構(gòu)建總代價矩陣,所述總代價矩陣包括樣本的類內(nèi)代價和類間代價,并基于總代價矩陣生成一系列自適應(yīng)代價敏感分類器,自適應(yīng)代價敏感分類器的最終目標函數(shù),其表達式為:
minH||(XTH-Y)⊙F||2,1+δ||H||2,1 式12
其中,X表示訓(xùn)練樣本的特征矩陣,Y表示訓(xùn)練樣本的標簽矩陣,H表示投影矩陣,δ是平衡參數(shù),F(xiàn)表示總代價矩陣,|| ||2,1表示L21范數(shù),⊙表示兩個相同維數(shù)的向量或矩陣之間的元素乘法運算符;
步驟6,離散F度量的區(qū)間范圍,通過迭代優(yōu)化算法來選擇F度量值最大的訓(xùn)練樣本集上的分類器作為最優(yōu)分類器,基于最優(yōu)分類器的投影矩陣,并對投影矩陣中行向量的模進行排序,選取排序靠前的,個行向量對應(yīng)的特征作為隱寫檢測的有效特征。
2.如權(quán)利要求1所述的基于自適應(yīng)代價敏感特征學習的不平衡隱寫分析方法,其特征在于:步驟2中具體實現(xiàn)方式如下,
對于給定的不平衡訓(xùn)練樣本集,令X=[x1,...,xn]∈Rd×n表示訓(xùn)練樣本的特征矩陣,其中n和d分別表示訓(xùn)練樣本數(shù)量和特征維數(shù),矩陣的標簽Y=[y1;…;yn]∈{-1,1}n×m由訓(xùn)練樣本對應(yīng)的標簽向量組成,其中m為類標簽的數(shù)量,并且yi為第i個訓(xùn)練樣本的標簽的行向量,預(yù)處理的目標是保證兩個向量Xzi和xi之間的距離盡可能近,Xzi表示重構(gòu)后的第i個樣本,該問題用最小二乘損失函數(shù)表示如式1所示:
其中Z=[z1,...,zn]∈Rn×n為重構(gòu)系數(shù)矩陣,為了防止過擬合,提高泛化能力,在式1中加入L2范數(shù)作為正則化項,其表達式改寫如下:
其中μ是調(diào)優(yōu)參數(shù)以確保在欠擬合與過擬合之間保持平衡,其式2的近似解表示為:
Z=(XTX+μE)-1XTX 式3
其中E是單位矩陣;
引入L1范數(shù)來實現(xiàn)式3的稀疏化,即利用生成的稀疏重構(gòu)系數(shù)矩陣Z,從樣本中選擇一些有效的特征來表示每個要重建的樣本,即
其中Z≥0表示矩陣Z的每個元素都是非負的;
通過數(shù)學變換引入正則化項,得到重建過程的目標函數(shù):
其中R1(Z)=Tr(ZTXTLXZ),Tr(A)表示矩陣的跡,L∈Rd×d表示特征之間關(guān)系信息的拉普拉斯矩陣;
最終的目標函數(shù)是凸的而不是光滑的,使用迭代法對式7進行優(yōu)化,并通過迭代優(yōu)化得到最優(yōu)解Z*,即最優(yōu)重構(gòu)系數(shù)矩陣Z*。
3.如權(quán)利要求1所述的基于自適應(yīng)代價敏感特征學習的不平衡隱寫分析方法,其特征在于:步驟3中,每個訓(xùn)練樣本的最優(yōu)k值通過如下方式具體實現(xiàn),
Z*中的元素zij反映第i個訓(xùn)練樣本與第j個訓(xùn)練樣本之間的相關(guān)關(guān)系,元素的非零值,即zij≠0表示第i個訓(xùn)練樣本與第j個訓(xùn)練樣本之間存在相關(guān)性,而0值,即zij=0表示它們之間不存在相關(guān)性,通過統(tǒng)計相關(guān)的訓(xùn)練樣本個數(shù),為每個訓(xùn)練樣本確定最優(yōu)的k。
4.如權(quán)利要求3所述的基于自適應(yīng)代價敏感特征學習的不平衡隱寫分析方法,其特征在于:步驟6的具體實現(xiàn)方式如下,
設(shè)總代價矩陣表示為F=[f1,…,fm]∈Rn×m,f=[f1,...,fn]T∈Rn為總代價向量,m是總代價向量的數(shù)量,n指訓(xùn)練樣本的個數(shù),對式12變形得到以下表達式:
XAθBAθXThθ-XAθBAθyθ+δQhθ=0 式13
其中hθ表示投影矩陣H中第θ個列向量,1≤θ≤m,δ是平衡參數(shù),Aθ、B和Q都是對角矩陣,對角矩陣Aθ∈Rn×n通過下式產(chǎn)生;
Aθ=diag(fθ) 式14
其中,fθ是總代價矩陣F的第θ個列向量,diag(fθ)取fθ的第θ個元素組成對角矩陣;B∈Rn×n的第i個對角元素為,
ε是一個小的擾動參數(shù),用于調(diào)整bii;此外,當ε→0時,目標函數(shù)在式12中相當于最小化以下問題:
同理,Q∈Rd×d的第i個對角元素qii由下式計算:
hi表示投影矩陣H的第i個行向量,因此,得到下面的封閉形式的解:
hθ=(XAθBAθXT+δQ)-1·(XAθBAθyθ) 式18
通過迭代算法求得投影矩陣的列向量hθ,最終獲得的投影矩陣H的每個行向量hi,計算||hi||值,并將其值進行排序,依據(jù)排序順序選擇靠前的hi對應(yīng)的訓(xùn)練樣本的特征。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于武漢大學,未經(jīng)武漢大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010217273.7/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 使用后向自適應(yīng)規(guī)則進行整數(shù)數(shù)據(jù)的無損自適應(yīng)Golomb/Rice編碼和解碼
- 一種自適應(yīng)軟件UML建模及其形式化驗證方法
- 媒體自適應(yīng)參數(shù)的調(diào)整方法、系統(tǒng)及相關(guān)設(shè)備
- 五自由度自適應(yīng)位姿調(diào)整平臺
- 采用自適應(yīng)機匣和自適應(yīng)風扇的智能發(fā)動機
- 一種自適應(yīng)樹木自動涂白裝置
- 一種基于微服務(wù)的多層次自適應(yīng)方法
- 一種天然氣發(fā)動機燃氣自適應(yīng)控制方法及系統(tǒng)
- 一種中心自適應(yīng)的焊接跟蹤機頭
- 一種有砟軌道沉降自適應(yīng)式軌道系統(tǒng)





