[發明專利]一種基于文本的消費意圖分析方法有效
| 申請號: | 202110485144.0 | 申請日: | 2021-04-30 |
| 公開(公告)號: | CN113095088B | 公開(公告)日: | 2022-03-04 |
| 發明(設計)人: | 丁效;劉挺;秦兵;蔡碧波 | 申請(專利權)人: | 哈爾濱工業大學 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/216;G06N20/00 |
| 代理公司: | 哈爾濱華夏松花江知識產權代理有限公司 23213 | 代理人: | 岳昕 |
| 地址: | 150001 黑龍*** | 國省代碼: | 黑龍江;23 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 文本 消費 意圖 分析 方法 | ||
1.一種基于文本的消費意圖分析方法,其特征在于,所述方法具體包括以下步驟:
步驟一、利用基于預訓練語言模型的序列標記模型構建事件消費圖;
所述步驟一的具體過程為:
從電子商務的評論數據中標記出部分事件-產品對,并利用標記出的事件-產品對以及標記出的事件-產品對所在的評論句子對基于預訓練語言模型的序列標記模型進行訓練;
再利用訓練好的基于預訓練語言模型的序列標記模型從未標記的電子商務評論數據中提取事件-產品對,將從包含噪聲的評論數據中提取出的事件-產品對剔除后,獲得篩選后的事件-產品對;
通過補充事件-事件關系、產品-產品關系,再根據篩選所得到的事件-產品關系,構建事件消費圖;
所述補充事件-事件關系、產品-產品關系,其具體過程為:
事件-事件關系的補充
利用預訓練語言模型分別得到每個事件的稠密表示,再根據得到的稠密表示計算兩個事件的余弦相似度,若兩個事件的余弦相似度大于等于設定的相似度閾值,則在兩個事件之間添加一條邊,否則不添加;
產品-產品關系的補充
遵循電子商務網站的產品分類系統來判斷產品是否屬于同一類別,若兩個產品屬于同一類別,則在兩個產品之間添加一條邊,否則不添加;
步驟二、抽取事件消費圖中節點的語義角度嵌入和結構角度嵌入;
所述步驟二中,抽取事件消費圖中節點的語義角度嵌入,其具體過程為:
對于事件消費圖中的任一產品節點Vp,在事件消費圖中檢索到所有包含產品節點Vp的事件-產品對(Ve,Vp),將檢索到的每個事件-產品對分別處理為([CLS]Ve,[CLS]Vp),其中,Ve為事件-產品對中的事件節點,[CLS]Ve為Ve所在的評論句子的開頭,[CLS]Vp為Vp所在的評論句子的開頭;
將([CLS]Ve,[CLS]Vp)輸入預訓練語言模型,將產品節點Vp的[CLS]令牌的最終隱藏狀態作為產品節點Vp的表示,若檢索到的事件-產品對(Ve,Vp)的個數為K,則產品節點Vp的語義角度嵌入為K個表示的平均;
同理,獲得每個事件節點的語義角度嵌入;
所述步驟二中,抽取事件消費圖中節點的結構角度嵌入,其具體過程為:
節點類型集為A={a1,a2},其中,ai代表第i種類型的節點,i=1,2,每種類型節點的元結構數的集合為U={u1,u2},ui代表第i種類型節點的元結構數;
對于第i種類型節點ai,預定義的元結構集為對應的誘導鄰接矩陣為其中,為ai的第j個元結構,j=1,2,…,ui,為誘導鄰接矩陣中的第j個元素;
根據誘導鄰接矩陣生成每個元結構的結構矩陣,再將生成的各個結構矩陣分別壓縮成一個結構向量,壓縮成的結構向量組成的集合為cj表示基于第j個元結構的結構向量;
采用多頭注意機制將每個元結構的結構向量進行融合,得到節點ai的密集結構表示,即節點ai的結構角度嵌入;
其中,βj為cj的權重;
步驟三、將步驟二獲得的語義角度嵌入和結構角度嵌入輸入第一MLP進行訓練,輸出為同一個節點的語義角度嵌入和結構角度嵌入的融合結果,即分別輸出每個節點的語義角度嵌入和結構角度嵌入的融合結果;
步驟四、基于步驟三獲得的融合結果,通過節點聚合獲得給定事件節點e和給定產品節點p的表示形式,再將給定事件節點e的表示形式與給定產品節點p的表示形式連接,將連接結果輸入第二MLP進行訓練;
步驟五、對于關系待預測的事件節點e′和產品節點p′,將事件節點e′和產品節點p′融入構建的事件消費圖后,抽取出事件節點e′的語義角度嵌入和結構角度嵌入以及產品節點p′的語義角度嵌入和結構角度嵌入;
利用訓練好的第一MLP對語義角度嵌入和結構角度嵌入進行融合,得到事件節點e′的語義角度嵌入和結構角度嵌入的融合結果以及產品節點p′的語義角度嵌入和結構角度嵌入的融合結果;
再通過節點聚合獲得事件節點e′和產品節點p′的表示形式,將事件節點e′的表示形式與產品節點p′的表示形式連接,將連接結果輸入訓練好的第二MLP進行關系預測。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱工業大學,未經哈爾濱工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110485144.0/1.html,轉載請聲明來源鉆瓜專利網。





