[發明專利]語義實體關系抽取方法、裝置及電子設備有效
| 申請號: | 201810633241.8 | 申請日: | 2018-06-15 |
| 公開(公告)號: | CN108874778B | 公開(公告)日: | 2023-01-17 |
| 發明(設計)人: | 趙淦森;梁昕;列海權;徐崗;趙淑嫻;紀求華;林成創;李勝龍;唐境燦;蔡斯凱;李振宇;黃偉雄;曲成 | 申請(專利權)人: | 廣東蔚海數問大數據科技有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/279;G06F40/242;G06F40/211 |
| 代理公司: | 北京超凡志成知識產權代理事務所(普通合伙) 11371 | 代理人: | 唐維虎 |
| 地址: | 510000 廣東省廣州市天河北路9*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語義 實體 關系 抽取 方法 裝置 電子設備 | ||
1.一種語義實體關系抽取方法,其特征在于,包括:
識別出輸入文本的每個詞節點;
構建每個詞節點的依存特征;其中,所述依存特征包括:候選節點的依存路徑和子節點依存特征路徑字典;所述候選節點的依存路徑為候選節點指向子節點的依存路徑;所述子節點依存特征路徑字典由子節點指向候選節點的依存路徑組成;
其中,所述輸入文本中包含有多個所述詞節點;
所述候選節點為所述輸入文本中的所述詞節點,所述子節點為所述輸入文本中的與所述候選節點存在依存關系的所述詞節點;
所述子節點依存特征路徑字典中包括多個所述子節點指向候選節點的依存路徑;
當有兩個以上詞節點為并列關系時,通過遞歸調用預存的語義規則,抽取出候選節點的關系三元組;
其中,所述預存的語義規則包括前修飾結構規則和動詞相關規則;
所述當有兩個以上詞節點為并列關系時,通過遞歸調用預存的語義規則,抽取出候選節點的關系三元組,具體包括:
當有兩個以上詞節點為并列關系時,判斷所述依存特征的關系類型;
所述關系類型為事件關系時,對每個動詞候選節點先抽取主語,再通過遞歸調用預存的主謂動賓結構規則或主謂介賓結構規則,抽取與主語相關的多組謂語和賓語,構成多組關系三元組;
所述關系類型為事實關系時,對每個實體候選節點先抽取前修飾詞,再通過遞歸調用預存的前修飾結構規則,抽取與前修飾詞相關的多組關系詞和關系實體,構成多組關系三元組。
2.根據權利要求1所述的方法,其特征在于,所述事件關系包括:動詞相關類結構,其中,動詞相關類結構包括主謂動賓結構,以及主謂介賓結構;
所述事實關系包括:前修飾類結構,其中,前修飾類結構包括組合式定語結構,以及由結構助詞“的”與中心語連接的結構。
3.根據權利要求2所述的方法,其特征在于,所述事實關系還包括:謂語為“是”或“是”的同義詞的主謂動賓結構。
4.根據權利要求1所述的方法,其特征在于,在所述識別出輸入文本的每個詞節點之后,還包括:
對輸入文本進行預處理。
5.一種語義實體關系抽取裝置,其特征在于,包括:
識別模塊,用于識別出輸入文本的每個詞節點;
構建模塊,用于構建每個詞節點的依存特征;其中,所述依存特征包括:候選節點的依存路徑和子節點依存特征路徑字典;所述候選節點的依存路徑為候選節點指向子節點的依存路徑;所述子節點依存特征路徑字典由子節點指向候選節點的依存路徑組成;
其中,所述輸入文本中包含有多個所述詞節點;
所述候選節點為所述輸入文本中的所述詞節點,所述子節點為所述輸入文本中的與所述候選節點存在依存關系的所述詞節點;
所述子節點依存特征路徑字典中包括多個所述子節點指向候選節點的依存路徑;
抽取模塊,用于當有兩個以上詞節點為并列關系時,通過遞歸調用預存的語義規則,抽取出候選節點的關系三元組;
其中,所述預存的語義規則包括前修飾結構規則和動詞相關規則;
所述當有兩個以上詞節點為并列關系時,通過遞歸調用預存的語義規則,抽取出候選節點的關系三元組,具體包括:
當有兩個以上詞節點為并列關系時,判斷所述依存特征的關系類型;
所述關系類型為事件關系時,對每個動詞候選節點先抽取主語,再通過遞歸調用預存的主謂動賓結構規則或主謂介賓結構規則,抽取與主語相關的多組謂語和賓語,構成多組關系三元組;
所述關系類型為事實關系時,對每個實體候選節點先抽取前修飾詞,再通過遞歸調用預存的前修飾結構規則,抽取與前修飾詞相關的多組關系詞和關系實體,構成多組關系三元組。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東蔚海數問大數據科技有限公司,未經廣東蔚海數問大數據科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810633241.8/1.html,轉載請聲明來源鉆瓜專利網。





