[發(fā)明專(zhuān)利]文本事件抽取方法及裝置在審
| 申請(qǐng)?zhí)枺?/td> | 201910959652.0 | 申請(qǐng)日: | 2019-10-10 |
| 公開(kāi)(公告)號(hào): | CN110727803A | 公開(kāi)(公告)日: | 2020-01-24 |
| 發(fā)明(設(shè)計(jì))人: | 羅華剛 | 申請(qǐng)(專(zhuān)利權(quán))人: | 北京明略軟件系統(tǒng)有限公司 |
| 主分類(lèi)號(hào): | G06F16/36 | 分類(lèi)號(hào): | G06F16/36;G06F16/33;G06F40/211;G06F40/289 |
| 代理公司: | 11240 北京康信知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 | 代理人: | 劉旺貴 |
| 地址: | 100086 北京市海淀區(qū)*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 文本 抽取 句法結(jié)構(gòu) 文本信息 分詞 句子 知識(shí)庫(kù) 依存句法分析 文本事件 形式構(gòu)建 規(guī)范化 圖譜 清洗 補(bǔ)充 分析 | ||
1.一種文本事件抽取方法,其特征在于,包括:
對(duì)待處理的文本進(jìn)行清洗和分詞;
對(duì)分詞后的所述文本進(jìn)行依存句法分析,以獲取所述文本中每個(gè)句子的句子成分;
依據(jù)知識(shí)庫(kù)和所述文本的上下文對(duì)句子進(jìn)行成分補(bǔ)充和實(shí)體規(guī)范化,以抽取所述文本中的事件;
依據(jù)句法結(jié)構(gòu)以實(shí)體-關(guān)系-實(shí)體的形式構(gòu)建所述事件的圖譜。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,在依據(jù)句法結(jié)構(gòu)以實(shí)體-關(guān)系-實(shí)體的形式構(gòu)建所述事件的圖譜之前,還包括:
將抽取的事件與數(shù)據(jù)庫(kù)內(nèi)的事件進(jìn)行相似度比較,當(dāng)相似度超過(guò)設(shè)定閾值時(shí),則確定為相同事件;
對(duì)相同事件進(jìn)行合并,對(duì)于不同事件按照新事件存入數(shù)據(jù)庫(kù)。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,在依據(jù)句法結(jié)構(gòu)以實(shí)體-關(guān)系-實(shí)體的形式構(gòu)建所述文本中事件的圖譜之后,還包括:
將所述事件的圖譜進(jìn)行可視化展示。
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,還包括:
如果所述事件為數(shù)據(jù)庫(kù)中的已有事件,可單獨(dú)展示所述事件的圖譜或與數(shù)據(jù)庫(kù)中的已有事件合并后展示合并事件的圖譜。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,在對(duì)待處理的文本進(jìn)行清洗和分詞之前,還包括:
獲取所述待處理的文本。
6.一種文本事件抽取裝置,其特征在于,包括:
分詞模塊,用于對(duì)待處理的文本進(jìn)行清洗和分詞;
句法分析模塊,用于對(duì)分詞后的所述文本進(jìn)行依存句法分析,以獲取所述文本中每個(gè)句子的句子成分;
補(bǔ)充模塊,用于依據(jù)知識(shí)庫(kù)和所述文本的上下文對(duì)句子進(jìn)行成分補(bǔ)充和實(shí)體規(guī)范化,以抽取所述文本中的事件;
構(gòu)建模塊,用于依據(jù)句法結(jié)構(gòu)以實(shí)體-關(guān)系-實(shí)體的形式構(gòu)建所述事件的圖譜。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,還包括:
比較模塊,用于將抽取的事件與數(shù)據(jù)庫(kù)內(nèi)的事件進(jìn)行相似度比較,當(dāng)相似度超過(guò)設(shè)定閾值時(shí),則確定為相同事件;
合并模塊,用于對(duì)相同事件進(jìn)行合并,對(duì)于不同事件按照新事件存入數(shù)據(jù)庫(kù)。
8.根據(jù)權(quán)利要求6所述的裝置,其特征在于,還包括:
展示模塊,用于將所述事件的圖譜進(jìn)行可視化展示。
9.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述存儲(chǔ)介質(zhì)中存儲(chǔ)有計(jì)算機(jī)程序,其中,所述計(jì)算機(jī)程序被設(shè)置為運(yùn)行時(shí)執(zhí)行所述權(quán)利要求1至5任一項(xiàng)中所述的方法。
10.一種電子裝置,包括存儲(chǔ)器和處理器,其特征在于,所述存儲(chǔ)器中存儲(chǔ)有計(jì)算機(jī)程序,所述處理器被設(shè)置為運(yùn)行所述計(jì)算機(jī)程序以執(zhí)行所述權(quán)利要求1至5任一項(xiàng)中所述的方法。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于北京明略軟件系統(tǒng)有限公司,未經(jīng)北京明略軟件系統(tǒng)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910959652.0/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識(shí)別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級(jí)連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計(jì)算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 文本生成方法、裝置和電子設(shè)備
- 一種基于多特征語(yǔ)義樹(shù)核的關(guān)系抽取方法和信息檢索方法
- 一種漢語(yǔ)二分結(jié)構(gòu)的句法分析方法
- 用于電腦的圖形用戶界面(34)
- 問(wèn)答檢索方法、問(wèn)答檢索裝置、問(wèn)答檢索設(shè)備及介質(zhì)
- 用信號(hào)發(fā)送360度視頻信息
- 用于處理圖像的方法及其設(shè)備
- 一種中文結(jié)構(gòu)化事件抽取方法
- 自下而上規(guī)則結(jié)合神經(jīng)網(wǎng)絡(luò)的成分句法分析樹(shù)構(gòu)造方法
- 一種基于句法樹(shù)遍歷的信息融合翻譯方法
- 一種考慮句法結(jié)構(gòu)的機(jī)器閱讀理解方法及裝置
- 一種文本信息顯示方法及終端
- 一種文本信息展示方法及裝置
- 一種非結(jié)構(gòu)化文本的關(guān)鍵信息挖掘方法、介質(zhì)及設(shè)備
- 一種目標(biāo)實(shí)體鏈接方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 信息標(biāo)注方法、裝置、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)及電子設(shè)備
- 一種文本信息識(shí)別的方法、人機(jī)對(duì)話的方法及相關(guān)裝置
- 文本匹配方法、文本匹配模型的訓(xùn)練方法及裝置、設(shè)備
- 文本信息修正方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 文本分類(lèi)方法、裝置和電子設(shè)備
- 文本翻譯方法、裝置、設(shè)備及介質(zhì)





