[發(fā)明專利]一種基于層次注意力機(jī)制的半監(jiān)督網(wǎng)絡(luò)表示學(xué)習(xí)模型在審
| 申請?zhí)枺?/td> | 201910821415.8 | 申請日: | 2019-09-02 |
| 公開(公告)號: | CN110781271A | 公開(公告)日: | 2020-02-11 |
| 發(fā)明(設(shè)計)人: | 姚宗強(qiáng);崇志強(qiáng);劉杰;徐福華;周作靜;馬世乾;楊曉靜;郭悅;尚學(xué)軍;王偉臣;鄧君怡;李國棟;霍現(xiàn)旭;王旭東;黃志剛;呂金炳;張文政;張津沛;蘇立偉 | 申請(專利權(quán))人: | 國網(wǎng)天津市電力公司電力科學(xué)研究院;國網(wǎng)天津靜海供電有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/35;G06F40/30 |
| 代理公司: | 12209 天津盛理知識產(chǎn)權(quán)代理有限公司 | 代理人: | 王來佳 |
| 地址: | 300384 *** | 國省代碼: | 天津;12 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 半監(jiān)督 向量 注意力機(jī)制 節(jié)點標(biāo)簽 文本表示 語義編碼 節(jié)點分類 節(jié)點結(jié)構(gòu) 網(wǎng)絡(luò)表示 網(wǎng)絡(luò)節(jié)點 引入 鏈接 學(xué)習(xí) 預(yù)測 | ||
1.一種基于層次注意力機(jī)制的半監(jiān)督網(wǎng)絡(luò)表示學(xué)習(xí)模型,其特征在于:包括如下步驟:
步驟1),詞級語義編碼:輸入以句號分句的節(jié)點文本,使用詞向量查詢的方法初始化每個詞的初始語義表示,后利用雙向GRU以序列的方式對句中的詞進(jìn)行高層的語義編碼;
步驟2),句級語義編碼:根據(jù)詞的高層語義表示,以詞級注意力機(jī)制得到句子的初始語義表示,后利用另一組雙向GRU學(xué)習(xí)文本中每個句子的高層語義表示;
步驟3),節(jié)點文本表示:根據(jù)句子的高層語義表示,以句級注意力機(jī)制得到文本的表示向量,與節(jié)點文本中各詞的詞向量平均池化向量相加得到節(jié)點的文本表示;
步驟4),得到節(jié)點結(jié)構(gòu)表示向量及節(jié)點的表示向量:隨機(jī)初始化節(jié)點結(jié)構(gòu)表示向量,用對數(shù)似然損失函數(shù)優(yōu)化得到結(jié)構(gòu)表示向量,將節(jié)點的文本表示向量與結(jié)構(gòu)表示向量拼接得到節(jié)點的表示向量;
步驟5),半監(jiān)督框架下引入節(jié)點標(biāo)簽:在半監(jiān)督學(xué)習(xí)的框架下,將帶標(biāo)簽節(jié)點的標(biāo)簽信息引入網(wǎng)絡(luò)表示學(xué)習(xí),將分類損失與步驟4中的對數(shù)似然損失聯(lián)合優(yōu)化得到最終的節(jié)點表示向量。
2.根據(jù)權(quán)利要求1所述的一種基于層次注意力機(jī)制的半監(jiān)督網(wǎng)絡(luò)表示學(xué)習(xí)模型,其特征在于:所述的步驟1)中,輸入以句號分句的節(jié)點文本,其中節(jié)點u的文本信息可表示為如下形式:
Du=(Su1,Su2,…,Suq)
其中,Sui為節(jié)點u文本的第i個句子,q為該文本所包含的句子總數(shù);
Sui可表示為:
其中為句子Sui的第j個詞,以隨機(jī)初始化的d維詞向量表示,m為該句子所包含的詞的個數(shù)。
3.根據(jù)權(quán)利要求1所述的一種基于層次注意力機(jī)制的半監(jiān)督網(wǎng)絡(luò)表示學(xué)習(xí)模型,其特征在于:所述的步驟1)中,為了獲取句中詞的高層語義表示,使用雙向GRU對詞向量進(jìn)行編碼,t時刻GRU的狀態(tài)ht通過如下公式計算:
rt=σ(Wrxt+Urht-1+br)
zt=σ(Wzxt+Uzht-1+bz)
公式中,rt、zt分別代表重置門、更新門,用于控制信息的傳遞,σ為sigmoid激活函數(shù),W、U和b為網(wǎng)絡(luò)參數(shù),⊙代表矩陣元素乘法,xt為序列在t時刻的表示向量,為t時刻GRU的候選狀態(tài)。
4.根據(jù)權(quán)利要求1所述的一種基于層次注意力機(jī)制的半監(jiān)督網(wǎng)絡(luò)表示學(xué)習(xí)模型,其特征在于:所述的步驟1)中,利用雙向GRU以序列的方式對句中的詞進(jìn)行高層的語義編碼的具體步驟為:
步驟1.1)前向的GRU編碼階段:
利用GRU對句中的詞向量序列按照原始順序進(jìn)行編碼得到前向的隱藏特征,對于第i個句中的第j個詞,
步驟1.2)反向的GRU編碼階段:
步驟1.3)雙向編碼特征結(jié)合階段:
將步驟1.1)與步驟1.2)中得到的兩個方向的隱藏特征向量進(jìn)行拼接,得到每個詞雙向的高層語義表示:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于國網(wǎng)天津市電力公司電力科學(xué)研究院;國網(wǎng)天津靜海供電有限公司,未經(jīng)國網(wǎng)天津市電力公司電力科學(xué)研究院;國網(wǎng)天津靜海供電有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910821415.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種安全的半監(jiān)督學(xué)習(xí)方法
- 基于半監(jiān)督學(xué)習(xí)的腦部CT圖像出血區(qū)域分割方法及系統(tǒng)
- 實現(xiàn)自動半監(jiān)督機(jī)器學(xué)習(xí)的方法及裝置
- 基于協(xié)同表示的安全半監(jiān)督超限學(xué)習(xí)機(jī)分類方法
- 基于生成對抗網(wǎng)絡(luò)的半監(jiān)督X光圖像自動標(biāo)注
- 一種基于注意力機(jī)制的甲狀腺結(jié)節(jié)半監(jiān)督分割方法
- 基于自適應(yīng)風(fēng)險度的安全半監(jiān)督學(xué)習(xí)的腦電信號識別方法
- 一種自適應(yīng)確定隱層節(jié)點數(shù)的增量半監(jiān)督超限學(xué)習(xí)機(jī)系統(tǒng)
- 半監(jiān)督語義分割模型訓(xùn)練方法、識別方法和裝置
- 基于半監(jiān)督深度分類算法的數(shù)據(jù)分類方法、設(shè)備及裝置
- 文本主題提取方法、裝置及存儲介質(zhì)
- 一種基于多樣圖注意力機(jī)制的知識圖譜嵌入方法
- 一種基于注意力機(jī)制的膠囊網(wǎng)絡(luò)多特征提取方法
- 一種基于多級注意力網(wǎng)絡(luò)的倉儲糧堆溫度預(yù)測方法及裝置
- 一種基于字符與自注意力機(jī)制的層次文本分類方法及中文文本分類方法
- 基于注意力機(jī)制殘差網(wǎng)絡(luò)的攝像監(jiān)控狀態(tài)分類方法
- 一種基于雙階段注意力機(jī)制生成對抗網(wǎng)絡(luò)的金融時間序列預(yù)測方法
- 文字識別方法、裝置、電子設(shè)備及存儲介質(zhì)
- 基于通道增強(qiáng)的雙注意力生成對抗網(wǎng)絡(luò)及圖像生成方法
- 一種基于多尺度深度監(jiān)督的反向注意力模型
- 一種標(biāo)簽轉(zhuǎn)發(fā)表項建立方法、節(jié)點設(shè)備和系統(tǒng)
- 一種標(biāo)簽確定方法、設(shè)備和系統(tǒng)
- 一種基于LF和UWB的室內(nèi)定位方法及標(biāo)簽節(jié)點
- 一種基于標(biāo)簽傳播算法的社區(qū)發(fā)現(xiàn)方法和裝置
- 一種數(shù)據(jù)轉(zhuǎn)發(fā)方法及裝置
- 節(jié)點標(biāo)簽的確定方法及裝置
- 一種基于節(jié)點標(biāo)簽的大數(shù)據(jù)集群任務(wù)調(diào)度方法及系統(tǒng)
- 數(shù)據(jù)處理方法及裝置、電子設(shè)備和計算機(jī)可讀存儲介質(zhì)
- 一種基于標(biāo)簽的消息推送方法、裝置和系統(tǒng)
- 一種基于隨機(jī)游走的標(biāo)簽傳播重疊社區(qū)發(fā)現(xiàn)方法及系統(tǒng)





