[發(fā)明專(zhuān)利]一種融入約束信息的遠(yuǎn)程監(jiān)督關(guān)系抽取方法有效
| 申請(qǐng)?zhí)枺?/td> | 202110366544.X | 申請(qǐng)日: | 2021-04-06 |
| 公開(kāi)(公告)號(hào): | CN112860903B | 公開(kāi)(公告)日: | 2022-02-22 |
| 發(fā)明(設(shè)計(jì))人: | 劉揚(yáng);梁天銘;劉曉燕;劉國(guó)軍;王春宇;郭茂祖 | 申請(qǐng)(專(zhuān)利權(quán))人: | 哈爾濱工業(yè)大學(xué) |
| 主分類(lèi)號(hào): | G06F16/35 | 分類(lèi)號(hào): | G06F16/35;G06F16/36;G06F40/205;G06F40/30 |
| 代理公司: | 哈爾濱華夏松花江知識(shí)產(chǎn)權(quán)代理有限公司 23213 | 代理人: | 岳昕 |
| 地址: | 150001 黑龍*** | 國(guó)省代碼: | 黑龍江;23 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 融入 約束 信息 遠(yuǎn)程 監(jiān)督 關(guān)系 抽取 方法 | ||
1.一種融入約束信息的遠(yuǎn)程監(jiān)督關(guān)系抽取方法,其特征在于包括以下步驟:
步驟一、獲取包含噪聲標(biāo)簽的文本數(shù)據(jù)集;
步驟二、設(shè)定需要抽取的關(guān)系,并根據(jù)每種關(guān)系的頭尾實(shí)體類(lèi)型約束規(guī)則構(gòu)建約束圖;
步驟三、將約束圖轉(zhuǎn)換為向量形式,并采用GCN構(gòu)建約束圖中關(guān)系和實(shí)體類(lèi)型的向量表示;
步驟四、根據(jù)目標(biāo)實(shí)體對(duì)將包含噪聲標(biāo)簽的文本數(shù)據(jù)集中的句子分組為不同的句子袋;
步驟五、對(duì)于每個(gè)句子袋,采用PCNN構(gòu)建句子袋中每個(gè)句子的向量表示;
步驟六、根據(jù)約束圖中關(guān)系和實(shí)體類(lèi)型的向量表示和句子袋中每個(gè)句子的向量表示計(jì)算句子袋中每個(gè)句子對(duì)于關(guān)系約束的權(quán)重值;
步驟七、根據(jù)得到的權(quán)重值,以句子袋中每條句子的向量加權(quán)和作為該句子袋的向量表示;
步驟八、根據(jù)句子袋的向量表示,采取Softmax分類(lèi)器進(jìn)行預(yù)測(cè),得到該句子袋屬于每種關(guān)系的概率值。
2.根據(jù)權(quán)利要求1所述的一種融入約束信息的遠(yuǎn)程監(jiān)督關(guān)系抽取方法,其特征在于所述步驟一中包含噪聲標(biāo)簽的文本數(shù)據(jù)集根據(jù)遠(yuǎn)程監(jiān)督假設(shè)通過(guò)對(duì)齊知識(shí)庫(kù)與無(wú)標(biāo)注文本中的實(shí)體對(duì)得到。
3.根據(jù)權(quán)利要求1所述的一種融入約束信息的遠(yuǎn)程監(jiān)督關(guān)系抽取方法,其特征在于所述步驟二中構(gòu)建約束圖的具體步驟為:
根據(jù)約束規(guī)則列表,將所有的關(guān)系和實(shí)體類(lèi)型的并集作為約束圖的點(diǎn)集;每條約束分別對(duì)應(yīng)邊和邊,將所有約束所對(duì)應(yīng)的邊加入約束圖的邊集,最后根據(jù)約束圖的點(diǎn)集和約束圖的邊集構(gòu)建約束圖,其中,r表示關(guān)系,表示關(guān)系r的頭實(shí)體類(lèi)型,表示關(guān)系r的尾實(shí)體類(lèi)型。
4.根據(jù)權(quán)利要求3所述的一種融入約束信息的遠(yuǎn)程監(jiān)督關(guān)系抽取方法,其特征在于所述步驟三中將約束圖轉(zhuǎn)換為向量形式的具體步驟為:
對(duì)于約束圖中的節(jié)點(diǎn),隨機(jī)初始化一個(gè)嵌入矩陣表示,根據(jù)約束圖的邊集,構(gòu)建約束圖的鄰接矩陣:
其中,ε為邊集,vi表示點(diǎn)集中的第i個(gè)節(jié)點(diǎn),vj表示點(diǎn)集中的第j個(gè)節(jié)點(diǎn)。
5.根據(jù)權(quán)利要求4所述的一種融入約束信息的遠(yuǎn)程監(jiān)督關(guān)系抽取方法,其特征在于所述步驟三中采用GCN構(gòu)建所述約束圖中關(guān)系和實(shí)體類(lèi)型的向量表示的具體步驟為:
其中,W(k)和b(k)分別表示第k層GCN的權(quán)重和偏置,ρ表示非線性函數(shù),i表示第i個(gè)節(jié)點(diǎn),表示第k層第i個(gè)節(jié)點(diǎn)的向量;
將最后一層的輸出矩陣,分割為關(guān)系表示矩陣R和實(shí)體類(lèi)型表示矩陣T,n表示包含噪聲標(biāo)簽的文本數(shù)據(jù)集中所包含的句子袋數(shù)目。
6.根據(jù)權(quán)利要求5所述的一種融入約束信息的遠(yuǎn)程監(jiān)督關(guān)系抽取方法,其特征在于所述步驟五中采用PCNN構(gòu)建句子袋中每個(gè)句子的向量表示為:
對(duì)于句子袋中句子的每個(gè)單詞,使用預(yù)訓(xùn)練的詞嵌入向量和相對(duì)位置嵌入向量進(jìn)行拼接,得到每個(gè)單詞所對(duì)應(yīng)的向量,根據(jù)每個(gè)單詞所對(duì)應(yīng)的向量并通過(guò)序列方向上的一維卷積操作得到每個(gè)單詞的隱向量表示,然后根據(jù)頭實(shí)體和尾實(shí)體在句子中的位置,將序列分為三段,分別對(duì)這三段的隱向量進(jìn)行最大值池化,最后將池化結(jié)果進(jìn)行拼接和非線性化,得到句子向量表示。
7.根據(jù)權(quán)利要求6所述的一種融入約束信息的遠(yuǎn)程監(jiān)督關(guān)系抽取方法,其特征在于所述步驟六中所述計(jì)算袋中每個(gè)句子對(duì)于關(guān)系約束的權(quán)重值的具體步驟為:
對(duì)于句子袋中的第i條句子,構(gòu)建示例向量表示gi;對(duì)于第k條約束,構(gòu)建約束向量表示ck,然后通過(guò)如下公式計(jì)算句子袋中第i條句子對(duì)于關(guān)系約束的權(quán)重值:
ei=gick
其中,ns表示句子袋中的句子數(shù)量,ei表示句子袋中第i條句子的向量表示和第k條關(guān)系約束的向量表示的相似度。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于哈爾濱工業(yè)大學(xué),未經(jīng)哈爾濱工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110366544.X/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 一種增強(qiáng)尼龍包容鋼齒輪
- 一種增強(qiáng)尼龍包容鋼齒輪
- 融入式市場(chǎng)系統(tǒng)和方法
- 煤矸石淋濾液消融入滲土柱模擬系統(tǒng)及特征參數(shù)測(cè)定方法
- 煤矸石淋濾液消融入滲室內(nèi)土柱模擬裝置
- 將句子權(quán)重融入神經(jīng)機(jī)器翻譯的領(lǐng)域適應(yīng)方法
- 融入依存關(guān)系的神經(jīng)機(jī)器翻譯方法
- 基于虛擬現(xiàn)實(shí)及多模態(tài)信息的孤獨(dú)癥輔助干預(yù)系統(tǒng)及方法
- 一種基于生成對(duì)抗網(wǎng)絡(luò)的視頻廣告融入系統(tǒng)與方法
- 基于融入空間信息的加權(quán)伽馬混合模型的SAR影像分割方法
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置
- 用于提供遠(yuǎn)程幫助的方法和服務(wù)器
- 遠(yuǎn)程登錄會(huì)話(huà)維護(hù)方法、遠(yuǎn)程登錄代理和計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)
- 汽車(chē)遠(yuǎn)程控制裝置和方法
- 一種基于EMS系統(tǒng)的變電站遠(yuǎn)程監(jiān)控系統(tǒng)
- 遠(yuǎn)程控制終端、遠(yuǎn)程控制方法、遠(yuǎn)程受控終端和遠(yuǎn)程受控方法
- 對(duì)遠(yuǎn)程受控終端的受控方式進(jìn)行自定義的裝置及方法
- 一種基于互聯(lián)網(wǎng)的移動(dòng)遠(yuǎn)程醫(yī)療綜合服務(wù)系統(tǒng)
- 一種遠(yuǎn)程控制方法、裝置及存儲(chǔ)介質(zhì)
- 一種遠(yuǎn)程炒菜機(jī)、遠(yuǎn)程炒菜機(jī)系統(tǒng)及遠(yuǎn)程炒菜方法
- 一種計(jì)算機(jī)遠(yuǎn)程控制組件





