[發(fā)明專利]一種遠(yuǎn)程監(jiān)督事件抽取方法及其應(yīng)用有效
| 申請(qǐng)?zhí)枺?/td> | 202010956662.1 | 申請(qǐng)日: | 2020-09-12 |
| 公開(kāi)(公告)號(hào): | CN112052665B | 公開(kāi)(公告)日: | 2023-06-20 |
| 發(fā)明(設(shè)計(jì))人: | 許偉川;張偉文;王德培 | 申請(qǐng)(專利權(quán))人: | 廣東工業(yè)大學(xué) |
| 主分類號(hào): | G06F40/211 | 分類號(hào): | G06F40/211;G06F40/284;G06F40/30;G06F16/33;G06F16/35 |
| 代理公司: | 成都方圓聿聯(lián)專利代理事務(wù)所(普通合伙) 51241 | 代理人: | 李鵬 |
| 地址: | 510006 廣東省廣州市*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 遠(yuǎn)程 監(jiān)督 事件 抽取 方法 及其 應(yīng)用 | ||
1.一種遠(yuǎn)程監(jiān)督事件抽取方法,其特征在于:包括:
S1構(gòu)建待抽取信息的觸發(fā)詞林;
S2構(gòu)建待抽取信息的知識(shí)庫(kù);
S3構(gòu)建待抽取信息的事件數(shù)據(jù)集;
S4通過(guò)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行事件抽?。?/p>
其中,
所述步驟S1包括:
S11通過(guò)手工定義的方式,定義待抽取信息領(lǐng)域內(nèi)的某一樣本信息的可能事件類型,及不同事件類型下的部分事件,構(gòu)建不同事件的一組核心觸發(fā)詞,設(shè)置所述核心觸發(fā)詞在其對(duì)應(yīng)事件中的觸發(fā)權(quán)重;
S12通過(guò)手工定義的方式,設(shè)置S11中定義的不同事件在不同事件類型下的觸發(fā)權(quán)重;
S13獲得不同類型事件的詞核向量;
S14通過(guò)候選觸發(fā)詞與所述詞核向量的加權(quán)詞向量余弦相似度,及其與相似度閾值的比較,獲得被定義事件的其他觸發(fā)詞;
S15由核心觸發(fā)詞及其他觸發(fā)詞組成該事件的觸發(fā)詞林;
其中,所述詞核向量通過(guò)對(duì)所述核心觸發(fā)詞的詞向量的最大池化獲得;
所述步驟S2包括:
S21獲得待抽取信息所在領(lǐng)域內(nèi)的現(xiàn)有知識(shí)文本,即儲(chǔ)備文本;
S22對(duì)儲(chǔ)備文本進(jìn)行包括分句、指代消歧及語(yǔ)義角色標(biāo)注在內(nèi)的基礎(chǔ)處理;
S23對(duì)通過(guò)基礎(chǔ)處理得到文本句子進(jìn)行觸發(fā)詞匹配,根據(jù)匹配后的事件得分,判斷該文本句子的事件類型;
S24對(duì)通過(guò)基礎(chǔ)處理得到文本句子的語(yǔ)義角色序列,及觸發(fā)詞與設(shè)定模板匹配,根據(jù)匹配結(jié)果,確定該文本句子的事件論元;
S25由所得事件類型、事件論元及所述觸發(fā)詞林組成所述待抽取信息的知識(shí)庫(kù);
其中,所述設(shè)定模板為:
[A0,觸發(fā)詞,A1],其中A0表示施事者,A1表示受事者;
其中,所述事件得分通過(guò)下式獲得:
其中,n表示觸發(fā)詞xk在文本句子內(nèi)出現(xiàn)的頻次,s表示該文本句子內(nèi)的全部觸發(fā)詞數(shù)量,表示觸發(fā)詞xk在事件類型為i的事件j下的得分,其可通過(guò)下式獲得:
其中,wi,j表示觸發(fā)詞xk在事件類型為i的事件j下的觸發(fā)權(quán)重,dk表示觸發(fā)詞xk的詞向量,cj表示事件j的詞核向量,|dk|表示觸發(fā)詞xk的詞向量的模,|cj|表示詞核向量的模。
2.根據(jù)權(quán)利要求1所述的事件抽取方法,其特征在于:所述加權(quán)詞向量余弦相似度為所述候選觸發(fā)詞與所述詞核向量的詞向量余弦相似度與不同事件在不同事件類型下的觸發(fā)權(quán)重的乘積。
3.根據(jù)權(quán)利要求2所述的事件抽取方法,其特征在于:所述詞向量、所述候選觸發(fā)詞及所述詞向量余弦相似度通過(guò)Word2vec模型獲得。
4.根據(jù)權(quán)利要求1所述的事件抽取方法,其特征在于:所述步驟S3包括:
S31將待抽取信息進(jìn)行分割,通過(guò)所述觸發(fā)詞林中的觸發(fā)詞對(duì)分割后不同部分的文本進(jìn)行匹配,根據(jù)匹配到的觸發(fā)詞在不同事件類型下的事件得分,及其與得分閾值的比較,獲得不同部分文本的候選事件類型;
S32通過(guò)待抽取信息的知識(shí)庫(kù)對(duì)有候選事件類型的不同部分文本進(jìn)行事件匹配,獲得不同部分文本的事件數(shù)據(jù),進(jìn)而獲得待抽取信息的事件數(shù)據(jù)集;
所述事件數(shù)據(jù)包括事件類型與事件論元。
5.根據(jù)權(quán)利要求1所述的事件抽取方法,其特征在于:所述神經(jīng)網(wǎng)絡(luò)模型包括事件分類模型與論元抽取模型;其中所述事件分類模型包括可對(duì)句子內(nèi)全部詞向量及實(shí)體詞向量分別進(jìn)行最大池化的最大池化層,將所述全部詞向量最大池化得到的句向量及所述實(shí)體詞向量最大池化得到的實(shí)體向量作為輸入并進(jìn)行轉(zhuǎn)換的transformer編碼層,將轉(zhuǎn)換后的句向量進(jìn)行卷積的卷積層,及其后的全連接層與softmax層;所述論元抽取模型包括對(duì)實(shí)體上下文信息進(jìn)行提取的卷積層,其后的最大池化層,將最大池化層得到的上下文特征向量與所述實(shí)體向量拼接后作為輸入的lstm網(wǎng)絡(luò)層,及其后的全連接層與softmax層。
6.根據(jù)權(quán)利要求5所述的事件抽取方法,其特征在于:所述神經(jīng)網(wǎng)絡(luò)模型的損失函數(shù)為事件分類模型的交叉熵?fù)p失函數(shù)與論元抽取模型的交叉熵?fù)p失函數(shù)的和。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣東工業(yè)大學(xué),未經(jīng)廣東工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010956662.1/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 用于提供遠(yuǎn)程幫助的方法和服務(wù)器
- 遠(yuǎn)程登錄會(huì)話維護(hù)方法、遠(yuǎn)程登錄代理和計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)
- 汽車遠(yuǎn)程控制裝置和方法
- 一種基于EMS系統(tǒng)的變電站遠(yuǎn)程監(jiān)控系統(tǒng)
- 遠(yuǎn)程控制終端、遠(yuǎn)程控制方法、遠(yuǎn)程受控終端和遠(yuǎn)程受控方法
- 對(duì)遠(yuǎn)程受控終端的受控方式進(jìn)行自定義的裝置及方法
- 一種基于互聯(lián)網(wǎng)的移動(dòng)遠(yuǎn)程醫(yī)療綜合服務(wù)系統(tǒng)
- 一種遠(yuǎn)程控制方法、裝置及存儲(chǔ)介質(zhì)
- 一種遠(yuǎn)程炒菜機(jī)、遠(yuǎn)程炒菜機(jī)系統(tǒng)及遠(yuǎn)程炒菜方法
- 一種計(jì)算機(jī)遠(yuǎn)程控制組件
- 在即時(shí)通信中提供即時(shí)監(jiān)督功能的方法及系統(tǒng)
- 一種監(jiān)督事件的生成裝置
- 一種資產(chǎn)托管監(jiān)督任務(wù)的處理方法及裝置
- 一種監(jiān)督方法及裝置
- 基于自監(jiān)督學(xué)習(xí)的標(biāo)簽比例學(xué)習(xí)模型的訓(xùn)練方法和設(shè)備
- 一種衛(wèi)生監(jiān)督對(duì)象尋址方法、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種機(jī)器人表情調(diào)用方法和家用機(jī)器人
- 計(jì)算機(jī)視覺(jué)訓(xùn)練系統(tǒng)和用于訓(xùn)練計(jì)算機(jī)視覺(jué)系統(tǒng)的方法
- 一種基于廠區(qū)智能管理系統(tǒng)的工廠設(shè)備監(jiān)督系統(tǒng)
- 信息化綜合監(jiān)督系統(tǒng)及方法
- 一種事件通訊裝置及方法
- 動(dòng)態(tài)權(quán)重事件處理系統(tǒng)和方法
- 攻擊檢測(cè)裝置和攻擊檢測(cè)方法
- 基于Unity的事件管理方法及系統(tǒng)
- 事件解析裝置、事件解析系統(tǒng)、事件解析方法及事件解析程序
- 事件解析裝置、事件解析系統(tǒng)、事件解析方法及事件解析程序
- 事件解析裝置、事件解析系統(tǒng)、事件解析方法及事件解析程序
- 熱點(diǎn)事件確定方法及裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種樹(shù)狀模型中節(jié)點(diǎn)的連接方法及其模型、計(jì)算機(jī)裝置和可讀存儲(chǔ)介質(zhì)
- 一種事件處理方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





