[發(fā)明專利]事件確認方法、裝置及電子設(shè)備有效
| 申請?zhí)枺?/td> | 201811282309.9 | 申請日: | 2018-10-29 |
| 公開(公告)號: | CN111104477B | 公開(公告)日: | 2023-04-14 |
| 發(fā)明(設(shè)計)人: | 劉英箎;李泉志;劉曉鐘;司羅 | 申請(專利權(quán))人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F40/263;G06F40/205;G06N3/08 |
| 代理公司: | 北京君以信知識產(chǎn)權(quán)代理有限公司 11789 | 代理人: | 譚鎮(zhèn) |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 事件 確認 方法 裝置 電子設(shè)備 | ||
1.一種事件確認方法,其特征在于,包括:
獲取文章中的待檢測詞;以及,獲取與所述待檢測詞對應(yīng)的句子片段;
對所述文章執(zhí)行詞向量嵌入,得到所述文章相關(guān)的詞向量,作為第一詞向量;以及,對所述句子片段執(zhí)行詞向量嵌入,得到所述句子片段相關(guān)的詞向量,作為第二詞向量;以及,對所述句子片段中的詞對應(yīng)的詞位置信息執(zhí)行詞位置向量嵌入,得到所述句子片段中的詞對應(yīng)的詞位置向量;
將所述第一詞向量、所述第二詞向量和所述詞位置向量作為事件類型預(yù)測模型的輸入數(shù)據(jù),所述事件類型預(yù)測模型包括文章級事件特征抽取子網(wǎng)絡(luò)、上下文級事件特征抽取子網(wǎng)絡(luò)和事件類型預(yù)測子網(wǎng)絡(luò);
通過所述文章級事件特征抽取子網(wǎng)絡(luò),根據(jù)所述第一詞向量抽取文章級事件特征,并通過所述上下文級事件特征抽取子網(wǎng)絡(luò),根據(jù)所述第二詞向量和所述詞位置向量抽取上下文級事件特征;
通過所述事件類型預(yù)測子網(wǎng)絡(luò),至少根據(jù)所述文章級事件特征和所述上下文級事件特征,獲取與所述待檢測詞對應(yīng)的事件類型的預(yù)測值,作為所述文章包括的事件類型。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括:
獲取在所述待檢測詞之前或之后出現(xiàn)的至少一個詞分別對應(yīng)的事件類型,作為相鄰詞的事件類型;
對所述相鄰詞的事件類型執(zhí)行事件類型向量嵌入,得到事件類型向量;
所述通過所述事件類型預(yù)測子網(wǎng)絡(luò),并至少根據(jù)所述文章級事件特征和所述上下文級事件特征,并獲取所述待檢測詞對應(yīng)的事件類型的預(yù)測值,包括:
通過所述事件類型預(yù)測子網(wǎng)絡(luò),根據(jù)所述文章級事件特征、所述上下文級事件特征和所述事件類型向量,獲取所述預(yù)測值。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,
所述文章級事件特征抽取子網(wǎng)絡(luò)包括:句子級事件特征確定子網(wǎng)絡(luò),段落級事件類型特征確定子網(wǎng)絡(luò),文章級事件特征確定子網(wǎng)絡(luò);
所述通過所述文章級事件特征抽取子網(wǎng)絡(luò),并根據(jù)所述第一詞向量抽取文章級事件特征,包括:
通過所述句子級事件特征確定子網(wǎng)絡(luò),根據(jù)所述第一詞向量,獲取所述文章包括的句子對應(yīng)的句子級事件特征;
通過所述段落級事件類型特征確定子網(wǎng)絡(luò),根據(jù)所述文章包括的句子對應(yīng)的句子級事件特征,獲取所述文章包括的段落對應(yīng)的段落級事件類型特征;
通過所述文章級事件特征確定子網(wǎng)絡(luò),根據(jù)所述段落級事件類型特征,獲取所述文章級事件特征。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,
所述句子級事件特征確定子網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)包括雙向長短期記憶網(wǎng)絡(luò)結(jié)構(gòu)Bi-LSTM;
所述通過所述句子級事件特征確定子網(wǎng)絡(luò),根據(jù)所述第一詞向量,獲取所述文章包括的句子對應(yīng)的句子級事件特征,包括:
將所述句子相關(guān)的第一詞向量的正向序列作為第一LSTM的輸入數(shù)據(jù),通過所述第一LSTM獲取所述句子的正向句子級事件特征;以及,將所述句子相關(guān)的第一詞向量的反向序列作為第二LSTM的輸入數(shù)據(jù),通過所述第二LSTM獲取所述句子的反向句子級事件特征;
根據(jù)所述正向句子級事件特征和所述反向句子級事件特征,獲取所述文章包括的句子對應(yīng)的句子級事件特征。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,
所述句子級事件特征確定子網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)還包括注意力層;
所述根據(jù)所述正向句子級事件特征和所述反向句子級事件特征,獲取所述文章包括的句子對應(yīng)的句子級事件特征,包括:
通過所述注意力層,根據(jù)所述正向句子級事件特征和所述反向句子級事件特征,獲取所述文章包括的句子對應(yīng)的句子級事件特征。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述上下文級事件特征抽取子網(wǎng)絡(luò)基于卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括:
從訓練樣本集中學習得到所述事件類型預(yù)測模型;
其中,所述訓練樣本包括訓練用待檢測詞對應(yīng)的文章、句子片段、所述句子片段中的詞對應(yīng)的詞位置信息與事件類型之間的對應(yīng)關(guān)系。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于阿里巴巴集團控股有限公司,未經(jīng)阿里巴巴集團控股有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811282309.9/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





