[發明專利]實體信息圖譜擴充方法及裝置在審
| 申請號: | 201710537951.6 | 申請日: | 2017-07-04 |
| 公開(公告)號: | CN109241289A | 公開(公告)日: | 2019-01-18 |
| 發明(設計)人: | 曾祥輝 | 申請(專利權)人: | 北京國雙科技有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F17/27 |
| 代理公司: | 北京康信知識產權代理有限責任公司 11240 | 代理人: | 趙囡囡;褚敏 |
| 地址: | 100086 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 實體信息 圖譜 語義分析結果 校驗結果 構建 一致性校驗 語義分析 預先創建 | ||
1.一種實體信息圖譜擴充方法,其特征在于,包括:
獲取預先構建的第一實體信息圖譜,其中,所述第一實體信息圖譜包括對先例文書進行語義分析后獲得的語義角色以及語義依存關系;
對預定文書進行語義分析,獲得語義分析結果;
基于獲得的所述語義分析結果構建第二實體信息圖譜;
將所述第一實體信息圖譜和所述第二實體信息圖譜進行一致性校驗,得到校驗結果;
基于所述校驗結果對第一實體信息圖譜進行擴充。
2.根據權利要求1所述的方法,其特征在于,所述對預定文書進行語義分析,獲得語義分析結果包括:
對所述預定文書進行分句處理,得到所述預定文書中的各個句子;
對所述各個句子的語義角色以及語義關系進行標注,獲得包括指代實體的詞的所述語義分析結果。
3.根據權利要求2所述的方法,其特征在于,所述基于獲得的所述語義分析結果構建第二實體信息圖譜包括:
根據所述語義分析結果中詞與實體的指向關系,形成句子之間的關聯關系;
基于所述關聯關系構建所述第二實體信息圖譜。
4.根據權利要求1所述的方法,其特征在于,所述將所述第一實體信息圖譜和所述第二實體信息圖譜進行一致性校驗,得到校驗結果包括:
將所述第一實體信息圖譜與所述第二實體信息圖譜進行比對操作;
基于所述比對操作獲得校驗結果。
5.根據權利要求1或4所述的方法,其特征在于,所述基于校驗結果對第一實體信息圖譜進行擴充包括:
在所述校驗結果是所述第一實體信息圖譜與所述第二實體信息圖譜不一致的情況下,獲得所述第一實體信息圖譜與所述第二實體信息圖譜的區別實體;
將所述區別實體擴充到所述第一實體信息圖譜中。
6.一種實體信息圖譜擴充裝置,其特征在于,包括:
第一獲取單元,用于獲取預先構建的第一實體信息圖譜,其中,所述第一實體信息圖譜包括對先例文書進行語義分析后獲得的語義角色以及語義依存關系;
第二獲取單元,用于對預定文書進行語義分析,獲得語義分析結果;
構建單元,用于基于獲得的所述語義分析結果構建第二實體信息圖譜;
校驗單元,用于將所述第一實體信息圖譜和所述第二實體信息圖譜進行一致性校驗,得到校驗結果;
擴充單元,用于基于所述校驗結果對第一實體信息圖譜進行擴充。
7.根據權利要求6所述的裝置,其特征在于,所述第二獲取單元包括:
第一獲取模塊,用于對所述預定文書進行分句處理,得到所述預定文書中的各個句子;
標注模塊,用于對所述各個句子的語義角色以及語義關系進行標注,獲得包括指代實體的詞的所述語義分析結果。
8.根據權利要求7所述的裝置,其特征在于,所述構建單元包括:
第一構建模塊,用于根據所述語義分析結果中詞與實體的指向關系,形成句子之間的關聯關系;
第二構建模塊,用于基于所述關聯關系構建所述第二實體信息圖譜。
9.一種存儲介質,其特征在于,所述存儲介質包括存儲的程序,其中,在所述程序運行時控制所述存儲介質所在設備執行權利要求1至5中任意一項所述的實體信息圖譜擴充方法。
10.一種處理器,其特征在于,所述處理器用于運行程序,其中,所述程序運行時執行權利要求1至5中任意一項所述的實體信息圖譜擴充方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京國雙科技有限公司,未經北京國雙科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710537951.6/1.html,轉載請聲明來源鉆瓜專利網。





