[發明專利]一種基于文本監督注意力的多模態廣告流行度預測方法在審
| 申請號: | 202111232184.0 | 申請日: | 2021-10-22 |
| 公開(公告)號: | CN113947436A | 公開(公告)日: | 2022-01-18 |
| 發明(設計)人: | 錢洋;許華華;姜元春;柴一棟;劉業政;徐旺;凌海峰;熊迎秋 | 申請(專利權)人: | 合肥工業大學 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02;G06F40/216;G06K9/62;G06N3/04;G06N3/08;G06Q10/04 |
| 代理公司: | 安徽省合肥新安專利代理有限責任公司 34101 | 代理人: | 陸麗莉;何梅生 |
| 地址: | 230009 安*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 文本 監督 注意力 多模態 廣告 流行 預測 方法 | ||
1.一種基于文本監督注意力的多模態廣告流行度預測方法,其特征是按如下步驟進行:
步驟1、構建多模態廣告數據集合D,用|D|表示多模態廣告數據集合D的數目,所述多模態廣告數據集合D中任意第i條廣告包含文本描述、圖像、標簽、標題、作者、時間的多模態信息,i∈[1,|D|];
步驟1.1、構建多模態廣告數據集合D的文本信息集合,所述文本信息集合中第i條廣告的文本信息,記為其中,wi,n表示第i條廣告的文本信息di中第n個詞匯,Ni表示文本信息di的總詞匯量,n∈[1,Ni];
步驟1.2、構建多模態廣告數據集合D的視覺信息集合,所述視覺信息集合中第i條廣告的視覺信息Ii,記為其中,pi,m表示第i條廣告的視覺信息Ii中第m個圖片,Mi表示視覺信息Ii的總圖片數,m∈[1,Mi];
步驟1.3、構建多模態廣告數據集合D的其他輔助信息集合,其中,第i條廣告的標簽信息集合記為li,第i條廣告的標題信息集合記為ti,第i條廣告的作者信息集合記為ai,第i條廣告的時間信息集合記為Ti;
步驟2、提取多模態廣告的特征;
步驟2.1、基于降噪主題模型獲取文本信息的特征表示;
步驟2.1.1、定義所有文本信息集合的主題分布為θ={θ1,θ2,…,θi,…,θ|D|},其中,θi表示第i條廣告的文本信息di的主題分布,且服從參數為α的狄利克雷分布,定義第i條廣告的文本信息di的主題分布θi由K個與流行度預測相關的主題{θi1,θi2,…,θik,…,θiK}和一個背景主題組成,其中,θik表示第i條廣告的文本信息di在第k個與流行度預測相關的主題上的概率分布值,k∈[1,K];
步驟2.1.2、令φk表示第k個主題詞分布,且φk服從參數為β0的狄利克雷分布,并有φk={φk1,φk2,…φkv,…φkV},其中,φkv表示第v個詞匯被分配給第k個主題的概率,v∈[1,V],V表示所有廣告的文本信息中不重復的詞匯總數;
令表示背景主題下的詞分布,且服從參數為β1的狄利克雷分布,并有其中,表示第v個詞匯被分配給背景主題的概率;
步驟2.1.3、定義二元指示變量b=(b1,b2,...,bi,...,b|D|),其中,bi表示第i個廣告的文本信息di中所有詞匯的主題所屬情況,并有其中,bin第i條廣告的文本信息di中第n個詞匯wi,n的主題所屬情況,且服從伯努利分布;
若bin=1,表示第i條廣告的文本信息di中第n個詞匯wi,n屬于與流行度預測相關的主題,則定義第i條廣告的文本信息di中第n個詞匯的與流行度預測相關的主題編號為zin,且服從參數為θi的多項式分布;定義第i條廣告的文本信息di的第n個詞匯wi,n服從參數為的多項式分布,其中,表示第i條廣告的文本信息di的第n個詞匯wi,n所屬的與流行度預測相關的第zin個主題下的詞概率分布;
若bin=0,表示第i條廣告的文本信息di的第n個詞匯wi,n屬于背景主題;定義第i條廣告的文本信息di的第n個詞匯wi,n服從參數為的多項式分布;
步驟2.1.4、使用式(1)~式(3)所示的坍塌式吉布斯抽樣分別計算第i條廣告的文本信息di的主題分布θi、第k個與流行度預測相關的主題下的詞分布φk和背景主題下的詞分布
式(1)~式(3)中,表示第i條廣告的文本信息di中分配到第k個與流行度預測相關的主題下的詞匯的數量;表示二元變量b為1時,所有文本信息中第v個詞匯分配到第k個與流行度預測相關的主題下的數量;表示二元變量b為0時,所有文本信息中第v個詞匯分配到背景主題下的數量;
根據第k個與流行度預測相關的主題下的詞分布φk,取概率最大的前E個詞匯對第k個與流行度預測相關的主題進行向量表征,并結合第i條廣告的文本信息di的主題分布θi,得到文本信息的特征矩陣其中,表示第i條廣告的文本信息di中第k個與流行度預測相關的主題的特征表示;
步驟2.2、通過預訓練的VGG-16網絡來提取圖片區域特征;
將第i條廣告的視覺信息Ii的第m張圖片pi,m劃分為Z個區域,得到圖片區域集合其中,表示第i條廣告的視覺信息Ii的第m張圖片pi,m中第z個區域;將第z個區域輸入VGG-16網絡,并輸出第m張圖片pi,m中第z個區域的特征表示vi,m,z,從而得到圖片區域的特征表示集合Vi,m=[vi,m,1,…,vi,m,z,…,vi,m,Z];
步驟2.3、獲取其他輔助信息的特征表示;
步驟2.3.1、獲取標簽和標題信息的特征表示;
將第i條廣告的標簽信息li的第j個標簽li,j表示為獨熱編碼yi,j,將第i條廣告的標簽信息li的所有標簽均表示為相應的獨熱編碼并構成編碼向量后輸入到LSTM模型,得到標簽信息li的特征向量;
由標簽信息li的特征向量構造標簽信息li的標簽特征矩陣并進行均值池操作后得到第i條廣告的標簽信息li的特征表示filabel;同理,得到第i條廣告的標題信息ti的特征表示fititle;
步驟2.3.2、獲取作者信息的特征表示;
使用作者信息集合ai的粉絲數fifollowers,作者信息集合ai的關注數fifollowings,作者信息集合ai的作品數fiworks作為第i條廣告的作者信息集合ai的特征表示,記為fiauthor=[fifollowers,fifollowings,fiworks];
步驟2.3.3、獲取時間信息的特征表示;
將第i條廣告的時間信息集合Ti的小時fihour、星期fiweek、日fiday、月fimonth、年fiyear作為第i條廣告的時間信息Ti的特征表示作,記為fitime=[fihour,fiweek,fiday,fimonth,fiyear];
步驟3、引入基于文本的注意力機制;
步驟3.1、引入如式(4)和式(5)所示的注意力機制,從而利用式(6)得到第i條廣告的文本信息di的特征表示Q為文本特征維度:
式(4)~式(6)中,為詞級別的文本特征表示的隱表示,S為隱藏層維度,Wtopic為隱表示的權重矩陣,btopic為隱表示的偏置向量,αi,k∈R為文本特征表示的注意力得分,Wa為文本注意力得分的權重矩陣,tanh表示正切激活函數,表示文本特征表示的隱表示,k′∈[1,K];
步驟3.2、通過基于文本的注意力機制得到每張圖片的特征表示;
利用式(7)和式(8)分別得到結合文本信息的圖片區域特征表示和第z個區域的注意力得分αi,m,z∈R,從而利用式(9)得到第m張圖片pi,m的特征表示
式(7)~式(9)中,Wregion為圖片區域特征表示的權重矩陣,Wtext為文本特征表示的權重矩陣,Wv為圖片區域注意力得分的權重矩陣;表示第i條廣告的視覺信息Ii中第m張圖片pi,m中第z′個區域的特征表示,z′∈[1,Z],⊙表示元素乘積;
步驟3.3、使用注意力機制融合多張圖片的特征,最終得到第i條廣告的視覺信息Ii的特征表示
利用式(10)得到第i條廣告的視覺信息Ii中第m張圖片pi,m的隱特征表示hi,m∈RQ,利用式(11)計算第m張圖片pi,m的注意力得分ai,m∈R,利用式(12)得到最終學習到的第i條廣告的視覺信息Ii的特征表示
式(10)~式(12)中,Wimage為圖片隱特征表示的權重矩陣,bimage為圖片隱特征表示的偏置向量,Wh為圖片注意力得分的權重矩陣;hi,m′表示第i條廣告的視覺信息Ii中第m′張圖片pi,m′的隱特征表示,m′∈[1,Mi];
步驟4、融合多模態廣告的文本與視覺特征;
利用式(13)所示的線性函數對文本特征與視覺特征進行融合,得到第i條廣告的融合表示
式(13)中,為外積;[]表示向量矩陣的線性化;
步驟5、利用融合后的全局特征預測流行度得分;
步驟5.1、將連接起來,得到第i條廣告的全局特征figlobal,從而得到所有廣告的全局特征fglobal并輸入如式(14)所示的分類器中預測流行度得分
式(14)中,Wg和bg為分類器的權重矩陣與偏差向量;
步驟5.2、采用如式(15)所示的二元交叉熵作為目標函數J:
式(15)中,C表示所述多模態數據集合D中作為訓練集的數據條數,yc表示訓練集中第c條廣告的真實流行度得分,表示訓練集中第c條廣告的預測流行度得分;1<C<|D|;
步驟5.3、設置最大迭代次數epoch_number,利用反向傳播和梯度下降法對目標函數J進行訓練,使得J達到最小,當迭代次數達到epoch_number時,停止訓練,從而得到最優預測模型,用于對所輸入的多模態廣告數據進行流行度得分的預測。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于合肥工業大學,未經合肥工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111232184.0/1.html,轉載請聲明來源鉆瓜專利網。





