[發(fā)明專(zhuān)利]一種基于消費(fèi)事理圖譜的消費(fèi)意圖識(shí)別和預(yù)測(cè)方法有效
| 申請(qǐng)?zhí)枺?/td> | 202011069677.2 | 申請(qǐng)日: | 2020-09-30 |
| 公開(kāi)(公告)號(hào): | CN112132633B | 公開(kāi)(公告)日: | 2021-07-06 |
| 發(fā)明(設(shè)計(jì))人: | 丁效;秦兵;劉挺;石乾坤 | 申請(qǐng)(專(zhuān)利權(quán))人: | 哈爾濱工業(yè)大學(xué) |
| 主分類(lèi)號(hào): | G06Q30/02 | 分類(lèi)號(hào): | G06Q30/02;G06F16/951 |
| 代理公司: | 哈爾濱華夏松花江知識(shí)產(chǎn)權(quán)代理有限公司 23213 | 代理人: | 岳昕 |
| 地址: | 150001 黑龍*** | 國(guó)省代碼: | 黑龍江;23 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 消費(fèi) 事理 圖譜 意圖 識(shí)別 預(yù)測(cè) 方法 | ||
1.一種基于消費(fèi)事理圖譜的消費(fèi)意圖識(shí)別和預(yù)測(cè)方法,其特征在于,該方法包括以下步驟:
步驟一、利用標(biāo)注了事件的數(shù)據(jù)對(duì)預(yù)訓(xùn)練好的BERT-Base模型進(jìn)行微調(diào)后,利用微調(diào)后的BERT-Base模型從敘事性文本中抽取得到事件;
步驟二、利用標(biāo)注了事件以及事件之間順承關(guān)系的數(shù)據(jù)對(duì)預(yù)訓(xùn)練好的BERT-Base模型進(jìn)行微調(diào)后,利用微調(diào)后的BERT-Base模型對(duì)步驟一中抽取的事件組成的事件對(duì)的順承關(guān)系進(jìn)行判別,構(gòu)建事理圖譜;
步驟三、根據(jù)步驟一中抽取出的事件構(gòu)建二分圖作為弱監(jiān)督信息;
步驟四、結(jié)合步驟二構(gòu)建的事理圖譜和步驟三得到的弱監(jiān)督信息,構(gòu)建消費(fèi)事理圖譜;其具體過(guò)程為:
定義:U表示所有的事件節(jié)點(diǎn),V表示所有的消費(fèi)意圖節(jié)點(diǎn),E1為關(guān)聯(lián)權(quán)重,即事件在各消費(fèi)意圖評(píng)論區(qū)中出現(xiàn)的頻率,G1=(U,V,E1)表示基于事件在各自消費(fèi)意圖評(píng)論區(qū)中出現(xiàn)的頻率而得到的二分圖;
G2=(U,V,E2)表示人工標(biāo)注的事件所對(duì)應(yīng)消費(fèi)意圖的數(shù)據(jù)構(gòu)成的二分圖,E2代表特定事件和消費(fèi)意圖具有或不具有對(duì)應(yīng)關(guān)系;
將G2分為訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集兩部分,訓(xùn)練數(shù)據(jù)集G2_train=(U_train,V,E2_train),測(cè)試數(shù)據(jù)集G2_test=(U_test,V,E2_test);U_train、E2_train表征訓(xùn)練數(shù)據(jù)集中的事件節(jié)點(diǎn)以及這些事件節(jié)點(diǎn)和消費(fèi)意圖是否構(gòu)成對(duì)應(yīng)關(guān)系;U_test、E2_test表征測(cè)試數(shù)據(jù)集中的事件節(jié)點(diǎn)以及這些事件節(jié)點(diǎn)和消費(fèi)意圖是否構(gòu)成對(duì)應(yīng)關(guān)系;
G3=(U,U,E3)表征事理圖譜,E3為事理圖譜的邊上的權(quán)值;
事件和消費(fèi)意圖的顯式關(guān)系建模:
給定訓(xùn)練數(shù)據(jù)集中的事件ui和消費(fèi)意圖vj,則通過(guò)公式計(jì)算二者之間存在邊的概率P(i,j)為:
基于G2_train:
其中:E2_train[i,j]代表事件ui和消費(fèi)意圖vj具有或不具有對(duì)應(yīng)關(guān)系,若事件ui和消費(fèi)意圖vj具有對(duì)應(yīng)關(guān)系,則的值為1,若事件ui和消費(fèi)意圖vj不具有對(duì)應(yīng)關(guān)系,則的值為0;
其中,L1代表第一個(gè)損失函數(shù)項(xiàng),eij代表事件ui和消費(fèi)意圖vj之間的邊,eij∈G1時(shí),事件ui和消費(fèi)意圖vj具有對(duì)應(yīng)關(guān)系,即
事件間的隱式關(guān)系建模:
若兩個(gè)事件節(jié)點(diǎn)ui1和ui2均與同一個(gè)消費(fèi)意圖節(jié)點(diǎn)相連,則兩個(gè)事件節(jié)點(diǎn)ui1和ui2之間存在隱式相鄰關(guān)系,即ui1和ui2為二階事件相鄰節(jié)點(diǎn);得到任意一個(gè)事件節(jié)點(diǎn)u在二分圖上的二階事件相鄰節(jié)點(diǎn)后,得到一個(gè)僅由節(jié)點(diǎn)u和二階事件相鄰節(jié)點(diǎn)構(gòu)成的圖G_u;
基于圖G_u,通過(guò)隨機(jī)游走得到語(yǔ)料庫(kù)S_u,采用和Skip-gram相同的思路,對(duì)第二個(gè)損失函數(shù)項(xiàng)L2進(jìn)行優(yōu)化:
式中,Neighbor(ui)代表節(jié)點(diǎn)ui的二階相鄰節(jié)點(diǎn)的集合,P(uc|ui)代表給定事件節(jié)點(diǎn)ui時(shí)事件節(jié)點(diǎn)uc出現(xiàn)的概率;
消費(fèi)意圖間的隱式關(guān)系建模:
同理,通過(guò)隨機(jī)游走得到由消費(fèi)意圖節(jié)點(diǎn)v構(gòu)成的語(yǔ)料庫(kù)S_v,對(duì)第三個(gè)損失函數(shù)項(xiàng)L3進(jìn)行優(yōu)化:
式中,Neighbor(vj)代表節(jié)點(diǎn)vj的二階消費(fèi)意圖相鄰節(jié)點(diǎn)的集合,P(vc|vj)代表給定消費(fèi)意圖節(jié)點(diǎn)vj時(shí)消費(fèi)意圖節(jié)點(diǎn)vc出現(xiàn)的概率;
則整體的優(yōu)化目標(biāo)L為:
minimizeL=L1-αlnL2-βlnL3
式中,α和β為損失函數(shù)的權(quán)重系數(shù);
滿足優(yōu)化目標(biāo)時(shí),得到基于G1、G2_train和G3的U、V的表示,構(gòu)建出消費(fèi)事理圖譜;
步驟五:建立同異質(zhì)關(guān)系注意力模型,基于構(gòu)建的消費(fèi)事理圖譜來(lái)訓(xùn)練建立的同異質(zhì)關(guān)系注意力模型;
將事件和消費(fèi)意圖輸入訓(xùn)練好的同異質(zhì)關(guān)系注意力模型后,模型輸出事件和消費(fèi)意圖存在或不存在對(duì)應(yīng)關(guān)系;
所述建立的同異質(zhì)關(guān)系注意力模型由事件編碼器和消費(fèi)意圖編碼器組成,事件編碼器和消費(fèi)意圖編碼器均由同質(zhì)關(guān)系聚合器和異質(zhì)關(guān)系聚合器組成;
事件編碼器
給定事件event,基于事理圖譜,得到該事件event的二階事件相鄰節(jié)點(diǎn)集合Neighbor_event_to_event(event);基于消費(fèi)圖譜,得到與該事件event具有對(duì)應(yīng)關(guān)系的消費(fèi)意圖節(jié)點(diǎn),得到的全部消費(fèi)意圖節(jié)點(diǎn)組成該事件event的消費(fèi)意圖相鄰節(jié)點(diǎn)集合Neighbor_event_to_consumption(event);
事件編碼器的同質(zhì)關(guān)系聚合器的輸入為該事件event和該事件的二階事件相鄰節(jié)點(diǎn)集合Neighbor_event_to_event(event);事件編碼器的異質(zhì)關(guān)系聚合器的輸入為該事件event的消費(fèi)意圖相鄰節(jié)點(diǎn)集合Neighbor_event_to_consumption(event),二者均通過(guò)Attention機(jī)制、分別利用同質(zhì)關(guān)系信息和異質(zhì)關(guān)系信息,得到該事件的隱含表示e1和e1′;
對(duì)于事件編碼器的同質(zhì)關(guān)系聚合器,給定事件event的隱含表示e1為:
其中,為事件同質(zhì)相似度,w1、W1和W2都是事件編碼器的同質(zhì)關(guān)系聚合器的權(quán)重,b1、b2和b3都是事件編碼器的同質(zhì)關(guān)系聚合器的偏置,αee為歸一化后的事件同質(zhì)相似度,x為事件event的二階事件相鄰節(jié)點(diǎn)集合中的節(jié)點(diǎn),eventhomo代表事件編碼器的同質(zhì)關(guān)系聚合器的輸出,符號(hào)代表向量之間的連接,σ是激活函數(shù);
對(duì)于事件編碼器的異質(zhì)關(guān)系聚合器,給定事件event的隱含表示e1′為:
其中,為事件異質(zhì)相似度,w2、W1′和W2′都是事件編碼器的異質(zhì)關(guān)系聚合器的權(quán)重,b1′、b2′和b3′都是事件編碼器的異質(zhì)關(guān)系聚合器的偏置,αec為歸一化后的事件異質(zhì)相似度,x′為事件event的消費(fèi)意圖鄰居節(jié)點(diǎn)集合中的節(jié)點(diǎn),eventhetero代表事件編碼器的異質(zhì)關(guān)系聚合器的輸出;
事件編碼器輸出事件的表示為:
其中,ventrepr為事件編碼器輸出事件的表示;
消費(fèi)意圖編碼器
給定消費(fèi)意圖consumption,若另一個(gè)消費(fèi)意圖consumption2和該消費(fèi)意圖均與同一個(gè)事件具有對(duì)應(yīng)關(guān)系,則認(rèn)為消費(fèi)意圖consumption2是該消費(fèi)意圖consumption的二階消費(fèi)意圖相鄰節(jié)點(diǎn),將消費(fèi)意圖consumption的全部二階消費(fèi)意圖相鄰節(jié)點(diǎn)consumption2構(gòu)成的集合稱(chēng)為二階消費(fèi)意圖相鄰節(jié)點(diǎn)集合Neighbor_con_to_con(consumption);基于消費(fèi)圖譜,得到消費(fèi)意圖consumption的事件相鄰節(jié)點(diǎn)集合Neighbor_con_to_event(consumption);
同質(zhì)關(guān)系聚合器的輸入為該消費(fèi)意圖consumption和該消費(fèi)意圖節(jié)點(diǎn)的二階消費(fèi)意圖相鄰節(jié)點(diǎn)集合Neighbor_con_to_con(consumption);異質(zhì)關(guān)系聚合器的輸入為該消費(fèi)意圖節(jié)點(diǎn)consumption的事件相鄰節(jié)點(diǎn)集合Neighbor_con_to_event(consumption),二者均通過(guò)Attention機(jī)制、分別利用同質(zhì)關(guān)系信息和異質(zhì)關(guān)系信息,得到該消費(fèi)意圖的隱含表示e2和e2′;
對(duì)于消費(fèi)意圖編碼器的同質(zhì)關(guān)系聚合器,給定消費(fèi)意圖節(jié)點(diǎn)的向量表示e2:
其中,為消費(fèi)意圖同質(zhì)相似度,w3、W3和W4都是消費(fèi)意圖編碼器的同質(zhì)關(guān)系聚合器的權(quán)重,b4、b5和b6都是消費(fèi)意圖編碼器的同質(zhì)關(guān)系聚合器的偏置,αcc為歸一化后的消費(fèi)意圖同質(zhì)相似度,x″為消費(fèi)意圖consumption的二階消費(fèi)意圖相鄰節(jié)點(diǎn)集合中的節(jié)點(diǎn),consumptionhomo代表消費(fèi)意圖編碼器的同質(zhì)關(guān)系聚合器的輸出;
對(duì)于消費(fèi)意圖編碼器的異質(zhì)關(guān)系聚合器,給定消費(fèi)意圖節(jié)點(diǎn)的向量表示e2′:
其中,為消費(fèi)意圖異質(zhì)相似度,w4、W3′和W4′都是消費(fèi)意圖編碼器的異質(zhì)關(guān)系聚合器的權(quán)重,b4′、b5′和b6′都是消費(fèi)意圖編碼器的異質(zhì)關(guān)系聚合器的偏置,αce為歸一化后的消費(fèi)意圖異質(zhì)相似度,x″′為消費(fèi)意圖節(jié)點(diǎn)的事件相鄰節(jié)點(diǎn)集合中的節(jié)點(diǎn),consumptionhetero代表消費(fèi)意圖編碼器的異質(zhì)關(guān)系聚合器的輸出;
消費(fèi)意圖編碼器輸出消費(fèi)意圖表示為:
其中,consumptionrepr為消費(fèi)意圖編碼器輸出消費(fèi)意圖;
基于獲得的事件表示和消費(fèi)意圖表示,得出事件與消費(fèi)意圖是否存在對(duì)應(yīng)關(guān)系:
g2=σ(W5·g1+b7)
pred=wT·g2
其中,g1和g2為中間變量,W5和w為權(quán)重,b7為偏置,pred為模型輸出結(jié)果。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于哈爾濱工業(yè)大學(xué),未經(jīng)哈爾濱工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011069677.2/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06Q 專(zhuān)門(mén)適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類(lèi)目不包含的專(zhuān)門(mén)適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的處理系統(tǒng)或方法
G06Q30-00 商業(yè),例如購(gòu)物或電子商務(wù)
G06Q30-02 .行銷(xiāo),例如,市場(chǎng)研究與分析、調(diào)查、促銷(xiāo)、廣告、買(mǎi)方剖析研究、客戶管理或獎(jiǎng)勵(lì);價(jià)格評(píng)估或確定
G06Q30-04 .簽單或開(kāi)發(fā)票
G06Q30-06 .購(gòu)買(mǎi)、出售或租賃交易
G06Q30-08 ..拍賣(mài)
- 案卷事理圖譜構(gòu)建方法、電子裝置及存儲(chǔ)介質(zhì)
- 一種基于事理推薦的邏輯圖譜構(gòu)建及預(yù)警方法和裝置
- 融合多類(lèi)事理與實(shí)體知識(shí)的領(lǐng)域事件圖譜構(gòu)建方法和裝置
- 一種事理關(guān)系提取方法及裝置
- 基于水利知識(shí)-事理耦合網(wǎng)絡(luò)的決策支持系統(tǒng)架構(gòu)與方法
- 一種基于事理圖譜的事件演化分析方法及裝置
- 一種文本事理關(guān)系的識(shí)別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于水文事件的事理圖譜構(gòu)建方法
- 一種用于對(duì)話系統(tǒng)的面向事件畫(huà)像的文本分析方法
- 一種事理圖譜路徑推演方法
- 用于圖譜界面的數(shù)據(jù)處理方法及系統(tǒng)
- 用于內(nèi)容特征圖譜化的特征圖譜布局的服務(wù)器及介質(zhì)
- 圖譜的構(gòu)建方法及裝置、電子設(shè)備
- 信息圖譜構(gòu)建方法、裝置及設(shè)備
- 知識(shí)圖譜的完善方法及裝置、數(shù)據(jù)處理方法及裝置
- 一種知識(shí)圖譜的構(gòu)建方法、裝置、知識(shí)圖譜系統(tǒng)及設(shè)備
- 一種基于知識(shí)圖譜的故障判別推理方法
- 一種事件圖譜的匹配方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種用于創(chuàng)建知識(shí)圖譜的計(jì)算機(jī)設(shè)備
- 一種支持增量實(shí)體關(guān)聯(lián)的關(guān)系圖譜計(jì)算方法





