[發明專利]實體信息圖譜擴充方法及裝置在審
| 申請號: | 201710537951.6 | 申請日: | 2017-07-04 |
| 公開(公告)號: | CN109241289A | 公開(公告)日: | 2019-01-18 |
| 發明(設計)人: | 曾祥輝 | 申請(專利權)人: | 北京國雙科技有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F17/27 |
| 代理公司: | 北京康信知識產權代理有限責任公司 11240 | 代理人: | 趙囡囡;褚敏 |
| 地址: | 100086 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 實體信息 圖譜 語義分析結果 校驗結果 構建 一致性校驗 語義分析 預先創建 | ||
本發明公開了一種實體信息圖譜擴充方法及裝置。其中,該方法包括:獲取預先創建的第一實體信息圖譜;對預定文書進行語義分析,獲得語義分析結果;基于獲得的語義分析結果構建第二實體信息圖譜;將第一實體信息圖譜和第二實體信息圖譜進行一致性校驗,得到校驗結果;基于校驗結果對第一實體信息圖譜進行擴充。本發明解決了相關技術中實體信息圖譜的構建效率低的技術問題。
技術領域
本發明涉及自然語言領域,具體而言,涉及一種實體信息圖譜擴充方法及裝置。
背景技術
在大數據時代,各行各業都在致力于大數據的挖掘與分析,然而大量的文本數據需要結構化后才能更好地應用于大數據分析。以司法領域為例,千萬級的文書、網頁信息都需要結構化,并與實體關聯。目前主要通過人工或者規則來實現維度抽取,費時費力且效果一般。
針對上述相關技術中實體信息圖譜的構建效率低的問題,目前尚未提出有效的解決方案。
發明內容
本發明實施例提供了一種實體信息圖譜擴充方法及裝置,以至少解決相關技術中實體信息圖譜的構建效率低的技術問題。
根據本發明實施例的一個方面,提供了一種實體信息圖譜擴充方法,包括:獲取預先構建的第一實體信息圖譜,其中,第一實體信息圖譜包括對先例文書進行語義分析后獲得的語義角色以及語義依存關系;對預定文書進行語義分析,獲得語義分析結果;基于獲得的語義分析結果構建第二實體信息圖譜;將第一實體信息圖譜和第二實體信息圖譜進行一致性校驗,得到校驗結果;基于校驗結果對第一實體信息圖譜進行擴充。
可選地,對預定文書進行語義分析,獲得語義分析結果包括:對預定文書進行分句處理,得到預定文書中的各個句子;對各個句子的語義角色以及語義關系進行標注,獲得包括指代實體的詞的語義分析結果。
可選地,基于獲得的語義分析結果構建第二實體信息圖譜包括:根據語義分析結果中詞與實體的指向關系,形成句子之間的關聯關系;基于關聯關系構建第二實體信息圖譜。
可選地,將第一實體信息圖譜和第二實體信息圖譜進行一致性校驗,得到校驗結果包括:將第一實體信息圖譜與第二實體信息圖譜進行比對操作;基于比對操作獲得校驗結果。
可選地,基于校驗結果對第一實體信息圖譜進行擴充包括:在校驗結果是第一實體信息圖譜與第二實體信息圖譜不一致的情況下,獲得第一實體信息圖譜與第二實體信息圖譜的區別實體;將區別實體擴充到第一實體信息圖譜中。
根據本發明實施例的另外一個方面,還提供了一種實體信息圖譜擴充裝置,包括:第一獲取單元,用于獲取預先構建的第一實體信息圖譜,其中,第一實體信息圖譜包括對先例文書進行語義分析后獲得的語義角色以及語義依存關系;第二獲取單元,用于對預定文書進行語義分析,獲得語義分析結果;構建單元,用于基于獲得的語義分析結果構建第二實體信息圖譜;校驗單元,用于將第一實體信息圖譜和第二實體信息圖譜進行一致性校驗,得到校驗結果;擴充單元,用于基于校驗結果對第一實體信息圖譜進行擴充。
可選地,第二獲取單元包括:第一獲取模塊,用于對預定文書進行分句處理,得到預定文書中的各個句子;標注模塊,用于對各個句子的語義角色以及語義關系進行標注,獲得包括指代實體的詞的語義分析結果。
可選地,構建單元包括:第一構建模塊,用于根據語義分析結果中詞與實體的指向關系,形成句子之間的關聯關系;第二構建模塊,用于基于關聯關系構建第二實體信息圖譜。
可選地,校驗單元包括:比對模塊,用于將第一實體信息圖譜與第二實體信息圖譜進行比對操作;第二獲取模塊,用于基于比對操作獲得校驗結果。
可選地,擴充單元包括:第三獲取模塊,用于在校驗結果是第一實體信息圖譜與第二實體信息圖譜不一致的情況下,獲得第一實體信息圖譜與第二實體信息圖譜的區別實體;擴充模塊,用于將區別實體擴充到第一實體信息圖譜中。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京國雙科技有限公司,未經北京國雙科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710537951.6/2.html,轉載請聲明來源鉆瓜專利網。





