日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種基于循環(huán)神經(jīng)網(wǎng)絡(luò)與潛變量結(jié)構(gòu)的詞語(yǔ)定義生成方法有效

專利信息
申請(qǐng)?zhí)枺?/td> 201910365929.7 申請(qǐng)日: 2019-04-30
公開(公告)號(hào): CN110083710B 公開(公告)日: 2021-04-02
發(fā)明(設(shè)計(jì))人: 杜永萍;張海同;王辰成 申請(qǐng)(專利權(quán))人: 北京工業(yè)大學(xué)
主分類號(hào): G06F16/36 分類號(hào): G06F16/36;G06K9/62;G06N3/04
代理公司: 北京思海天達(dá)知識(shí)產(chǎn)權(quán)代理有限公司 11203 代理人: 吳蔭芳
地址: 100124 *** 國(guó)省代碼: 北京;11
權(quán)利要求書: 查看更多 說(shuō)明書: 查看更多
摘要:
搜索關(guān)鍵詞: 一種 基于 循環(huán) 神經(jīng)網(wǎng)絡(luò) 變量 結(jié)構(gòu) 詞語(yǔ) 定義 生成 方法
【權(quán)利要求書】:

1.一種基于循環(huán)神經(jīng)網(wǎng)絡(luò)與潛變量結(jié)構(gòu)的詞語(yǔ)定義生成方法,其特征在于包括以下步驟:

(1)建立并整理基礎(chǔ)語(yǔ)料庫(kù);

所述的基礎(chǔ)語(yǔ)料庫(kù)的內(nèi)容包括被定義詞、詞性、領(lǐng)域、釋義、上下文信息;

所述的基礎(chǔ)語(yǔ)料庫(kù)采用詞典的詞語(yǔ)釋義語(yǔ)料集合的形式呈現(xiàn);

所述的整理包括兩部分,即對(duì)收集到的基礎(chǔ)語(yǔ)料進(jìn)行清洗,去除停用詞和功能詞,并按照一定的比例劃分訓(xùn)練集、驗(yàn)證集,以及整理基礎(chǔ)語(yǔ)料中被定義詞、釋義和上下文信息中出現(xiàn)的所有詞作為基礎(chǔ)語(yǔ)料庫(kù)詞表;

(2)選取被定義詞語(yǔ)的近義詞集合,擴(kuò)展基礎(chǔ)語(yǔ)料庫(kù),形成最終語(yǔ)料庫(kù);

計(jì)算被定義詞語(yǔ)與基礎(chǔ)語(yǔ)料庫(kù)詞表中每一個(gè)詞的相似度得分,選擇分?jǐn)?shù)最高的前n個(gè)詞作為被定義詞語(yǔ)的近義詞集合;基礎(chǔ)語(yǔ)料庫(kù)+被定義詞近義詞集合構(gòu)成最終語(yǔ)料庫(kù);

(3)對(duì)被定義詞語(yǔ)的詞向量進(jìn)行展重構(gòu),具體包括:

對(duì)被定義詞詞向量V*和最終語(yǔ)料庫(kù)詞表中出現(xiàn)詞語(yǔ)的詞向量進(jìn)行初始化;

在被定義詞的字符序列的開始和結(jié)束位置添加標(biāo)識(shí)符,輸入到雙向LSTM中,分別從正向和反向?qū)Ρ欢x詞進(jìn)行建模,將雙向LSTM最后一個(gè)時(shí)刻正向和反向的隱藏狀態(tài)進(jìn)行拼接,得到被定義詞的字符級(jí)信息VCH

對(duì)所述被定義詞近義詞集合的詞向量進(jìn)行初始化,將n個(gè)近義詞的詞向量進(jìn)行拼接,得到被定義詞的近義詞信息VSY

將初始化的被定義詞詞向量V*與所述字符級(jí)信息VCH和所述近義詞信息VSY進(jìn)行拼接,得到被定義詞擴(kuò)展重構(gòu)后的詞向量,如公式1所示:

V*=[V*,VCH,VSY] (1)

(4)構(gòu)建基于循環(huán)神經(jīng)網(wǎng)絡(luò)與潛變量結(jié)構(gòu)模型

模型包括上下文語(yǔ)義提取器模塊、釋義變分自編碼器模塊、釋義生成解碼器模塊三部分,

所述上下文語(yǔ)義提取器模塊用于根據(jù)被定義詞的上下文信息來(lái)提取被定義詞詞向量在相關(guān)語(yǔ)境中的含義,具體為:

將被定義詞的上下文信息輸入到雙向GRU中,將雙向GRU最后一個(gè)時(shí)刻正向和反向的隱藏狀態(tài)進(jìn)行拼接,得到上下文的嵌入表示Vs

對(duì)上下文嵌入表示Vs進(jìn)行線性變換操作來(lái)對(duì)齊空間,得到對(duì)齊后上下文表示TVs;按照公式2計(jì)算對(duì)齊后的上下文表示TVs與重構(gòu)的被定義詞詞向量V*之間的內(nèi)積d,具體計(jì)算公式如下:

d=TVs⊙V* (2)

其中T表示線性變換矩陣,⊙表示計(jì)算內(nèi)積操作;

利用Softmax進(jìn)行歸一化,按照公式3計(jì)算得到被定義詞詞向量基于上下文信息的二進(jìn)制掩碼mask,具體計(jì)算公式如下:

mask=Softmax(d) (3)

將被定義詞詞向量基于上下文信息的二進(jìn)制掩碼mask與重構(gòu)的被定義詞詞向量V*進(jìn)行拼接,進(jìn)行線性變換映射到相同的向量空間中,并使用Tanh進(jìn)行激活,得到語(yǔ)義向量m,具體計(jì)算公式如下:

m=tanh(Wc[mask:V*]+b) (4)

其中Wc表示線性變換矩陣,b為偏置項(xiàng),tanh為非線性激活函數(shù);

本模塊的輸出包括:被定義詞和上下文在向量空間中對(duì)齊后的上下文表示TVs和語(yǔ)義向量m;

所述釋義變分自編碼器模塊對(duì)釋義進(jìn)行建模,提取釋義的潛變量特征,彌補(bǔ)定義生成時(shí)信息不足的問(wèn)題,同時(shí)在生成定義時(shí)提供釋義的結(jié)構(gòu)信息,具體如下:

將被定義詞的釋義輸入到GRU中,取GRU最后一個(gè)時(shí)刻的隱藏狀態(tài)作為釋義的編碼特征,對(duì)編碼特征分別進(jìn)行兩個(gè)線性變換,映射到一個(gè)均值為0,標(biāo)準(zhǔn)差為1的潛變量空間Z中,通過(guò)Z重構(gòu)被定義詞的釋義,使得Z擬合被定義詞釋義的特征分布;

隨機(jī)生成兩個(gè)向量,一個(gè)表示均值,一個(gè)表示標(biāo)準(zhǔn)差,用標(biāo)準(zhǔn)正態(tài)分布乘上標(biāo)準(zhǔn)差再加上均值得到被定義詞釋義的潛變量特征z;

本模塊的輸出為被定義詞釋義的潛變量特征z;

所述的釋義生成解碼器模塊,基于GRU,用于聯(lián)合重構(gòu)后的被定義詞詞向量以及上下文信息和潛變量特征進(jìn)行被定義詞詞語(yǔ)定義的生成,具體如下:

釋義生成解碼器的輸入為被定義詞的釋義,釋義生成解碼器初始的隱藏狀態(tài)是由重構(gòu)的被定義詞詞向量、對(duì)齊的上下文表示、潛變量特征拼接,然后進(jìn)行線性映射得到的,具體表示如下:

V=[V*;TVs;z] (5)

將拼接之后的所述被定義詞的生成向量V經(jīng)過(guò)線性變換映射到所述釋義生成解碼器初始的隱藏狀態(tài)h0

在第一個(gè)時(shí)刻使用一個(gè)特殊的開始標(biāo)識(shí)BOS與語(yǔ)義向量m進(jìn)行拼接作為第一個(gè)時(shí)刻的釋義生成解碼器的輸入;之后在釋義生成解碼器每一個(gè)解碼的時(shí)刻t上將t時(shí)刻詞語(yǔ)的詞向量Vt與語(yǔ)義向量m進(jìn)行拼接,得到該時(shí)刻釋義生成解碼器的輸入xt,如公式6所示:

xt=[Vt;m] (6)

接收t時(shí)刻的輸入xt以及t-1時(shí)刻的隱藏表示ht-1,計(jì)算得到新的隱藏表示ht

將釋義生成解碼器t時(shí)刻的隱藏表示ht經(jīng)過(guò)線性變換按映射到一個(gè)詞表大小的概率分布Ot中,通過(guò)Softmax計(jì)算得到最終的概率分布,選擇分布概率最大的作為t時(shí)刻的輸出yt,如以下所示:

yt=argmax pt,i (7)

其中,為Softmax操作;

(5)訓(xùn)練基于循環(huán)神經(jīng)網(wǎng)絡(luò)與潛變量結(jié)構(gòu)模型,具體為:

首先使用WikiText-103數(shù)據(jù)對(duì)釋義生成解碼器部分進(jìn)行單獨(dú)的預(yù)訓(xùn)練,預(yù)訓(xùn)練時(shí)設(shè)置生成向量為0向量,當(dāng)連續(xù)n≥5個(gè)輪次epoch在驗(yàn)證集上的困惑度沒(méi)有下降時(shí),預(yù)訓(xùn)練完畢,選擇訓(xùn)練后在驗(yàn)證集上困惑度最低的模型參數(shù)進(jìn)行保存;

加載預(yù)訓(xùn)練之后釋義生成解碼器模塊的參數(shù),使用訓(xùn)練集對(duì)整體基于循環(huán)神經(jīng)網(wǎng)絡(luò)與潛變量結(jié)構(gòu)模型進(jìn)行訓(xùn)練優(yōu)化,當(dāng)連續(xù)n≥5個(gè)輪次epoch在驗(yàn)證集上的困惑度沒(méi)有下降時(shí),訓(xùn)練優(yōu)化結(jié)束;

(6)將待釋義詞語(yǔ)及其上下文信息輸入訓(xùn)練完成的模型中,使用τ=0.1的簡(jiǎn)單采樣算法進(jìn)行釋義生成,解碼器模塊在生成每一個(gè)字時(shí)可以同時(shí)考慮被定義詞的語(yǔ)義和語(yǔ)境信息,實(shí)現(xiàn)具體語(yǔ)境中待釋義詞語(yǔ)的語(yǔ)義釋義,解決一詞多義問(wèn)題。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京工業(yè)大學(xué),未經(jīng)北京工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201910365929.7/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說(shuō)明:

1、專利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專利說(shuō)明書;

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級(jí)中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級(jí)為極速版,下載速度顯著提升!歡迎使用!

請(qǐng)您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊(cè)】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識(shí) 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢?cè)诰€客服咨詢?cè)诰€客服
tel code back_top
主站蜘蛛池模板: 国产欧美日韩二区| 日韩中文字幕一区二区在线视频| 国产精品国外精品| 香蕉免费一区二区三区在线观看| 久久91精品国产91久久久| 偷拍久久精品视频| 久久精品亚洲一区二区三区画质| 国产一级一区二区| 黄色91在线观看| 免费看欧美中韩毛片影院| 亚洲欧美中日精品高清一区二区 | 亚洲国产精品一区在线| 视频一区二区三区中文字幕| 欧美在线观看视频一区二区三区| 性色av色香蕉一区二区| 国产精品精品视频一区二区三区| 丰满岳乱妇在线观看中字 | 日韩av一二三四区| 欧美久久精品一级c片| 国产日韩欧美专区| 狠狠躁夜夜躁xxxxaaaa| 97人人揉人人捏人人添| 久久午夜鲁丝片| 午夜片在线| 夜夜精品视频一区二区| 欧洲精品一区二区三区久久| 欧美一级久久久| 日韩av在线播| 91香蕉一区二区三区在线观看| 久久精品一二三| 亚洲精品456在线播放| 日本一区二区三区免费视频| 99精品视频一区| 综合久久色| 日韩精品免费一区二区三区| 国产精品99999999| 日韩精品一区在线视频| 亚洲精品国产一区二区三区| 老女人伦理hd| 国产欧美亚洲精品| 色综合久久网| 国产经典一区二区三区| 国产偷久久一区精品69| 国产乱码精品一区二区三区介绍| 国产剧情在线观看一区二区| 国产午夜精品免费一区二区三区视频| 亚洲五码在线| 欧美福利一区二区| 97国产精品久久| 国产午夜精品一区二区三区在线观看| 欧美精品日韩一区| 欧美日韩国产影院| 激情欧美日韩| 欧美一区二区三区日本| 日本丰满岳妇伦3在线观看| 大bbw大bbw巨大bbb| 日本黄页在线观看| 国产一区二区播放| 国产精品一区二区中文字幕| 午夜天堂电影| 素人av在线| 99国产精品久久久久老师| 综合国产一区| 日本二区在线观看| 视频一区二区三区中文字幕| 欧美网站一区二区三区| 国产麻豆一区二区三区在线观看 | 日本一区二区三区免费播放| 一区二区三区国产精华| 在线精品视频一区| 国产999在线观看| 日韩av在线中文| 国产精品中文字幕一区二区三区| 久久青草欧美一区二区三区| 人人玩人人添人人澡97| 日韩精品久久一区二区三区| 国产午夜精品理论片| 羞羞视频网站免费| 国产午夜精品一区二区理论影院 | 亚洲欧美一二三| 国产91视频一区二区| 狠狠色狠狠色综合系列|