日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種基于傳遞的同義詞擴展方法有效

專利信息
申請號: 202010063190.7 申請日: 2020-01-19
公開(公告)號: CN111274794B 公開(公告)日: 2022-03-18
發明(設計)人: 魯偉明;俞家樂;吳飛;莊越挺 申請(專利權)人: 浙江大學
主分類號: G06F40/247 分類號: G06F40/247;G06F40/284;G06N3/04;G06N3/08
代理公司: 杭州求是專利事務所有限公司 33200 代理人: 劉靜
地址: 310058 浙江*** 國省代碼: 浙江;33
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 基于 傳遞 同義詞 擴展 方法
【權利要求書】:

1.一種基于傳遞的同義詞擴展方法,其特征在于,包括以下步驟:

1)數據集構建:爬取并解析百科詞條正文,存儲到Lucene索引文件中,同時利用Word2Vec工具訓練詞向量;爬取百科詞條的多義詞頁面,解析得到每個頁面中所有多義義項,并從義項的詞條頁中獲取該義項的同義屬性;同一義項若存在多個同義詞,則以該義項名稱作為中間實體e2,任選它的兩個同義詞作為e1和e3,構成正例三元組t′=e1,e2,e3;具有相同名稱的不同義項,可以隨機選取兩個義項各自的同義詞分別作為e1和e3,與義項名e2構成負例三元組;所有實體三元組t′構成了集合T;根據已獲得的實體三元組集合,在語料的Lucene索引文件中進行布爾檢索,得到同時包含一對實體的所有語句si并構成共現語句包S={s1,s2,...,s|s|},即檢索e1和e2得到共現語句包S1,檢索e2和e3得到共現語句包S2

2)句子編碼:對步驟1)中每個實體三元組t′對應的兩個語句包S1和S2,采用BERT模型或BiLSTM模型進行句子編碼,具體過程如下:

a)BERT編碼:給定一個同時包含實體對ei和ej的語句s,利用BERT自帶分詞器對s進行分詞,并在s前后插入句子起始符“[CLS]”和終止符“[SEP]”,在兩個實體前后分別用特定符號“[ENT1]”和“[ENT2]”進行標示,得到語句序列s′={w0,w1,...,w|s|+5},其中wk為序列中第k個詞語;將預處理后的語句序列輸入到BERT模型中,獲得編碼后的整個序列表示H={h0,h1,...h|s|+5},其中hk為第k個詞的隱層向量輸出;根據兩個實體的位置,同時可以得到ei的序列表示和ej的序列表示整個句子的隱層表示為hs=h0,即“[CLS]”對應輸出;

b)BiLSTM編碼:給定一個同時包含實體對ei和ej的語句s,采用HanLP分詞器對s分詞,得到語句序列s″={w1,w2,...,w|s|};將序列中的每個詞wk轉換為詞嵌入后,拼接每個詞的詞向量與距離實體對ei和ej的兩個位置向量和作為該詞的嵌入表示其中dw為詞向量維度,dp為位置向量維度,為向量拼接操作;將序列輸入BiLSTM模型中進行編碼,正反向編碼公式如下:

其中,BiLSTM采用兩層標準的長短期記憶網絡,LSTMfw為正向編碼公式,LSTMbw為反向編碼公式,vt為第t個時間步的輸入,為正向第t個時間步的隱層輸出,為反向第t個時間步的隱層輸出,即對應句子中第t個詞語;

將正反向的隱層輸出拼接,得到作為第t個詞語的隱層表示,即獲得整個語句的序列表示H={h1,h2,...h|s|};類似上述步驟a),同時可得到ei的序列表示和ej的序列表示將正向最后一個時間步的隱層狀態與反向最后一個時間步的隱層狀態拼接,作為句子的隱層表示

c)句子表示:利用步驟a)或步驟b)對語句s編碼后,得到了句子隱層表示hs和實體序列表示與將hs經過一個包含激活函數tanh的全連接層轉化,得到句子向量vs,公式如下:

vs=tanh(Wshs+bs)

其中和為模型的可訓練參數,dh為編碼器隱層輸出的維度,dc為全連接層的輸出維度;

對實體序列中每個詞的隱層向量計算平均,同樣經過一個包含激活函數tanh的全連接層轉化,計算獲得ei的實體向量與ej的實體向量公式如下:

其中 和為模型的可訓練參數,k′∈{1,2,3}為實體編號;將句子向量與兩個實體向量拼接,作為該句子的最終表示

d)語句包表示:通過前三個步驟,對語句包S中每個語句進行編碼,得到語句向量集合同時采用注意力機制對語句包內的有效語句加以選擇,得到每個句子的注意力權重αi,計算公式如下:

公式采用的是乘法注意力,其中表示同義關系向量,由模型隨機初始化,維度與句子向量相同,exp為指數函數;

將所有語句向量進行加權求和,即得到語句包的向量表示Vs

將Vs依次經過一個全連接層和一個softmax層,得到預測概率p(ei≈ej|S),即模型基于語句包S,判別實體對ei和ej存在同義關系的概率,同時也驗證了語句選擇的有效性:

o=W1Vs+b1

其中和為模型的可訓練參數,o1和o2為向量o的兩個元素,o1對應模型預測為正確的維度,o2對應模型預測為錯誤的維度;

3)實體編碼:將實體三元組t′對應語句包S1和S2中的所有語句分別經過步驟2)中編碼器編碼后,獲得S1中e1的實體向量包和e2的實體向量包以及S2中e3的實體向量包和e2的實體向量包利用步驟2)中第d)步的句子注意力權重,對實體向量包進行加權,作為實體在整個語句包內的語義融合向量,公式如下:

其中k∈{1,2}為語句包編號,i∈{1,2,3}為實體編號,為語句包Sk中第j個語句的注意力權重,為該句中第i個實體;經過計算,得到四個實體融合向量和

接著采用門控機制分別將的語義融入將的語義融入得到e2在S1中的最終向量表示在S2中的最終向量表示公式為:

其中語句包編號k∈{1,2},實體編號i∈{1,3},為門控向量,是可訓練參數,維度與實體向量相同,⊙為向量元素乘操作;

4)多角度實體匹配:對步驟3)中得到的e2的兩個實體向量包和以及e2的兩個實體向量和同時采用E2E、E2B和B2B三種匹配進行多角度實體語義匹配,具體匹配過程如下:

a)E2E匹配:實體向量之間的匹配,利用向量元素乘的結果作為匹配向量Vm,其中為向量元素乘操作:

b)E2B匹配:實體向量和實體向量包之間的匹配,主要采用基于LSTM模塊的多步匹配策略,將中每個向量作為LSTM每一個時間步的輸入,并且不斷通過影響隱層狀態h′t的計算,以提取出與間語義相似的部分,計算公式如下:

其中LSTM(x,[h,c])為標準的LSTM單元,x為輸入,h和c分別為LSTM的隱層狀態和單元狀態;即按照標準LSTM進行循環計算,單元狀態ct不變,隱層狀態h′t只取前dc個元素,與當前輸入相加后拼接輸入到下一步計算中;i∈{1,2}和j∈{1,2}為語句包編號,為拼接操作;dc與實體向量維度相同;

以LSTM模塊最后一個時間步的輸出作為E2B的匹配向量,即匹配和得到匹配和得到

c)B2B匹配:實體向量包之間的匹配,實際為兩個包內所有向量間的兩兩匹配,首先計算和的相似度矩陣M:

其中為模型的可訓練參數,dc為實體向量維度;

對于中的某個向量與中每個向量匹配得到|S2|個相似分數,將所有分數取平均即得到與整個的相似分數,公式為:

其中mij為M中第i行第j列元素,mean_pooling為平均池化函數;

接著通過softmax公式計算中每個向量的對應權重向量,經過加權后獲得關于的匹配向量

在相似度矩陣M的第0維上進行操作為匹配,得到同理,在M的第1維上進行相同操作即為匹配,可得到

5)同義關系分類:將步驟4)中得到的五個匹配向量拼接,依次通過一個全連接層和一個softmax分類器,得到基于語句包S1和S2、實體三元組t′中e1和e3存在同義關系的概率p(e1≈e3|S1,S2):

其中為模型的可訓練參數,和為om中兩個元素,對應模型預測為正確的維度,對應模型預測為錯誤的維度;

6)模型訓練:采用交叉熵作為損失函數,通過步驟2)計算所有實例集合T對應的語句包的有效選擇概率,同時計算損失L1

其中和為第i個實例對應的兩個支持語句包,θ1為步驟2)中所有參數;

通過步驟5)獲得所有實例的預測概率,并計算損失L2

其中θ2為步驟3)至步驟5)中所有參數;

最終將步驟2)的有效語句選擇作為子任務,與步驟5)的同義關系預測主任務進行聯合訓練,即加和兩種損失作為模型的總損失L=L1+L2,并采用優化器最小化損失函數,獲得最佳模型。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大學,未經浙江大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202010063190.7/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 91久久久爱一区二区三区| 亚洲国产欧美国产综合一区| 国产精品久久国产三级国电话系列| 2023国产精品自产拍在线观看| 国产视频一区二区视频| 国产一级自拍| 激情久久一区| 国产一区二区a| 久久中文一区| 日韩av在线一区| 久久精品国产综合| 午夜伦理片在线观看| 久久人人精品| 国产精品综合久久| 亚洲国产精品一区二区久久hs | 国产高清在线精品一区二区三区| 狠狠色噜噜狠狠狠四色米奇| 国产精品免费不卡| 91免费国产| 国产精品一区二区麻豆| 国产一区观看| 国产主播啪啪| 欧美乱妇高清无乱码免费| 99爱精品视频| 少妇av一区二区三区| 国产视频在线一区二区| 国模精品免费看久久久| 一级久久久| 久久夜靖品2区| 精品一区二区三区视频?| 一区二区免费在线观看| 国产精品视频一区二区三| 久久久久久国产一区二区三区| 99久久精品免费看国产免费粉嫩| 99国精视频一区一区一三| 波多野结衣女教师电影| 在线国产精品一区二区| 国产一区二区精品在线| 色乱码一区二区三在线看| 国产精品精品视频一区二区三区| 97久久精品一区二区三区观看| 国产一区午夜| 欧美日韩国产一区二区三区在线观看| 99爱精品在线| 91久久国产露脸精品国产| 神马久久av| 国产精品一二三区免费| 国产欧美一区二区精品久久久| 亚洲欧美日本一区二区三区| 91国产在线看| 黑人巨大精品欧美黑寡妇| 日本福利一区二区| 欧美在线视频二区| 国产亚洲精品久久777777 | 午夜av片| 夜夜嗨av一区二区三区中文字幕| 国产一区二区三区四| 天堂av一区二区三区| 久久综合二区| 久久精品一二三四| 91高跟紫色丝袜呻吟在线观看| 亚洲国产精品区| 日本五十熟hd丰满| 激情aⅴ欧美一区二区三区| 久久国产精久久精产国| 亚洲欧洲另类精品久久综合| 国产精品刺激对白麻豆99| 欧美视频1区| 精品国产区一区二| 片毛片免费看| 狠狠色噜噜狠狠狠狠综合久| 二区三区视频| 日本aⅴ精品一区二区三区日| 88888888国产一区二区| 一色桃子av| 精品久久综合1区2区3区激情 | 国产欧美一区二区精品性| 精品国产一区二区三区高潮视| 国产精品白浆一区二区| 国产全肉乱妇杂乱视频在线观看| 精品久久一区| 亚洲精品丝袜| 精品久久久久99| 欧美国产精品久久| 亚洲国产精品日本| 香蕉视频一区二区三区| 蜜臀久久99精品久久久久久网站| 国产伦精品一区二区三区无广告| xxxx18hd护士hd护士| 日本三级不卡视频| 日韩中文字幕亚洲精品欧美| 日韩午夜电影在线| 黄色av免费| 99久久久国产精品免费调教网站| 一区二区三区日韩精品| 午夜影院伦理片| 亚洲二区在线播放视频| 国产三级欧美三级日产三级99| 国产精品视频一二区| 狠狠色噜狠狠狠狠| 欧洲另类类一二三四区| 国产免费一区二区三区四区| 亚洲国产aⅴ精品一区二区16| 国产精品久久久久四虎| 国产91麻豆视频| 国产极品一区二区三区| 国产日韩欧美精品一区| 欧美日韩精品在线一区二区| 亚洲精品日本久久一区二区三区 | 久久国产精品波多野结衣| 一区二区在线国产| 乱淫免费视频| 一区不卡av| 99国产午夜精品一区二区天美 | 国产日产欧美一区二区| 国产欧美综合一区| 欧洲在线一区| 日韩精品免费一区二区三区| 欧美乱妇高清无乱码免费 | 国产亚洲精品精品国产亚洲综合| 99久久精品免费视频| 国产精品久久久不卡| 国产午夜一级片| 国产精品电影免费观看| 国产精品一级在线| 大伊人av| 亚洲精品久久久久久久久久久久久久| 久久二区视频| 欧美极品少妇videossex| 日韩亚洲精品视频| 亚洲欧美自拍一区| 97久久精品一区二区三区观看| 日韩精品中文字幕久久臀| 亚洲国产精品国自产拍久久| 国产99视频精品免视看芒果| 亚洲精品国产suv| 亚洲欧洲一区二区| 亲子乱子伦xxxx| 国产suv精品一区二区4| 肉丝肉足丝袜一区二区三区| 91精品国产高清一区二区三区| 91丝袜诱惑| 国产在线精品二区| 国模精品免费看久久久| 亚洲s码欧洲m码在线观看| 日韩精品中文字| 国产伦精品一区二区三区免| 亚洲欧美色一区二区三区| 一本一道久久a久久精品综合蜜臀 国产三级在线视频一区二区三区 日韩欧美中文字幕一区 | 欧美日韩一区二区在线播放| 亚洲欧洲日韩av| 国产精品视频久久| 亚洲精品国产精品国自产网站按摩| 国产91在线播放| 日韩国产精品久久| 国产一二区在线| 国产91九色视频| 日本中文字幕一区| 国产一二区精品| 欧美日韩国产在线一区| 日韩精品一区二区中文字幕| 欧美一区二区三区久久久| 精品一区二区三区影院| 国产伦理久久精品久久久久| 狠狠色噜噜狠狠狠狠黑人| 国产精品久久国产精品99| 久久aⅴ国产欧美74aaa| 国产一区二区三区国产| 国产一区二区在线91| 日韩精品久久久久久久的张开腿让 | 欧美日韩卡一卡二| 亚洲理论影院| 欧美在线免费观看一区| 一级女性全黄久久生活片免费| 欧美在线视频一二三区| 国产一区二区三区黄| 免费午夜在线视频| 午夜大片男女免费观看爽爽爽尤物 | 99国产精品欧美久久久久的广告| 91精品啪在线观看国产线免费| 国产精品美乳在线观看| 国语对白一区二区| 精品国产一二三四区| 精品999久久久| 日韩一级片免费观看| 国产一区二区极品| 欧美一区二区三区免费看| 亚洲精品20p| 一二三区欧美| 欧美三区视频| 一区二区国产盗摄色噜噜| 日本精品一区二区三区视频| 国产床戏无遮挡免费观看网站| 国产精品久久99| 免费看农村bbwbbw高潮| 中出乱码av亚洲精品久久天堂| 性刺激久久久久久久久九色| 国产日韩欧美精品| 国产欧美一区二区三区沐欲| aaaaa国产欧美一区二区| 久久精品男人的天堂| 国产一区网址| 91精品视频免费在线观看| 国模一区二区三区白浆| 久久精品视频3| 国产99视频精品免费视频7| 97精品久久人人爽人人爽| 国产欧美www| 国产精品一区亚洲二区日本三区| 国产一二区精品| 国产精品综合在线| 精品国产一区二区三区免费| 欧美精品日韩精品| 国产区二区| 不卡在线一区二区| 久久中文一区| 精品a在线| 午夜一级电影| 国产精品v亚洲精品v日韩精品| 国产精品一区二| 国产精品久久免费视频| 亚洲国产精品一区在线观看| 一区二区三区国产视频| 国产91色综合| 亚洲国产一区二| 在线精品国产一区二区三区88| 国产超碰人人模人人爽人人添| 免费观看又色又爽又刺激的视频| 国产在线一区观看| 91麻豆文化传媒在线观看| 国产99久久久久久免费看| 日韩一区二区中文字幕| 国产一区二区三区色噜噜小说| 国产综合亚洲精品| 国产精品亚州| 国产区二区| 国产精品二区一区二区aⅴ| 九九国产精品视频| 国产精品爽到爆呻吟高潮不挺| 美女张开腿黄网站免费| 亚洲国产精品麻豆| 国产不卡一区在线| 麻豆国产一区二区三区| xxxx18hd护士hd护士| 国产91精品一区| 日韩av在线播放网址|