[發明專利]基于多模態的電力營銷熱點挖掘方法在審
| 申請號: | 202111435180.2 | 申請日: | 2021-11-29 |
| 公開(公告)號: | CN114116981A | 公開(公告)日: | 2022-03-01 |
| 發明(設計)人: | 何瑋;吳偉將;吳卓超;孫少辰;俞陽 | 申請(專利權)人: | 國網江蘇省電力有限公司營銷服務中心 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06Q50/06;G06N3/04;G06F40/216 |
| 代理公司: | 北京智繪未來專利代理事務所(普通合伙) 11689 | 代理人: | 張紅蓮;王萍 |
| 地址: | 210019 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 多模態 電力 營銷 熱點 挖掘 方法 | ||
1.基于多模態的電力營銷熱點挖掘方法,其特征在于:
所述方法包括以下步驟:
步驟1,采集電力營銷中包括文本描述及其對應的圖像描述的客戶互動數據,將其匯總構成電力營銷多模態熱點挖掘數據集;
步驟2,對熱點挖掘數據集中的文本描述進行預處理;
步驟3,對預處理后的熱點挖掘數據集分別進行圖像模態特征抽取和文本模態特征抽取,獲取圖像模態與文本模態的特征向量;
步驟4,使用跨模態注意力機制將圖像模態特征和文本模態特征融合得到多模態融合特征,并基于多模態融合特征,利用CRF模型從文本描述中抽取候選熱點詞;
步驟5,對步驟4抽取的每個候選熱點詞計算原始熱度值和熱度增速;
步驟6,結合原始熱度值與熱度增速,從候選熱點詞中篩選最終的熱點詞。
2.根據權利要求1所述的基于多模態的電力營銷熱點挖掘方法,其特征在于:
步驟1中,最終得到的電力營銷多模態熱點挖掘數據集表示為D={(xi,yi)}L,其中L為樣本個數,xi表示第i個樣本的文本描述,yi表示xi對應的圖像描述;
所述文本描述為用戶對事件的咨詢與申訴。
3.根據權利要求1所述的基于多模態的電力營銷熱點挖掘方法,其特征在于:
步驟2中,對熱點挖掘數據集中的文本描述進行預處理,具體為:對文本描述中的無效字符或者停用詞進行清洗。
4.根據權利要求1所述的基于多模態的電力營銷熱點挖掘方法,其特征在于:
步驟3所述圖像模態特征抽取,具體為:
采用VGG網絡中的VGG-16結構配置對圖像描述進行視覺特征提取,提取公式為:
e(y)=VGG16(y)
其中,y為輸入的圖像描述,e(y)為VGG-16輸出的低維編碼特征向量,描述圖像的視覺特征,圖像特征轉化成一個向量。
5.根據權利要求1所述的基于多模態的電力營銷熱點挖掘方法,其特征在于:
步驟3所述文本模態特征抽取,具體為:
從文本描述提取文本特征,公式為:
zt=σ(Wxzxt+Whzht-1)
rt=σ(Wxrxt+Whrht-1)
其中,
Wxz和Whz分別表示在求解zt時,為xt和ht-1分配的可訓練的二維參數矩陣;
Wxr和Whr分別表示在求解rt時,為xt和ht-1分配的可訓練的二維參數矩陣;
和分別表示在求解時,為xt和ht-1分配的可訓練的二維參數矩陣;
σ表示sigmoid激活函數;
xt是在文本描述的第t個字;tanh表示tanh激活函數;
ht-1是在解碼步驟t-1的隱藏層輸出;
是綜合ht與xt的隱藏狀態;
rt是控制隱藏層ht-1在先前時間對于此時單詞xt的影響;
zt是隱含向量,決定是否需要遺忘此時單詞xt;
e’(xt)為最后輸出的局部文本模態特征;
之后,采用預訓練語言模型BERT對知識進行表示。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國網江蘇省電力有限公司營銷服務中心,未經國網江蘇省電力有限公司營銷服務中心許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111435180.2/1.html,轉載請聲明來源鉆瓜專利網。





