[發明專利]語義實體關系抽取方法、裝置及電子設備有效
| 申請號: | 201810633241.8 | 申請日: | 2018-06-15 |
| 公開(公告)號: | CN108874778B | 公開(公告)日: | 2023-01-17 |
| 發明(設計)人: | 趙淦森;梁昕;列海權;徐崗;趙淑嫻;紀求華;林成創;李勝龍;唐境燦;蔡斯凱;李振宇;黃偉雄;曲成 | 申請(專利權)人: | 廣東蔚海數問大數據科技有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/279;G06F40/242;G06F40/211 |
| 代理公司: | 北京超凡志成知識產權代理事務所(普通合伙) 11371 | 代理人: | 唐維虎 |
| 地址: | 510000 廣東省廣州市天河北路9*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語義 實體 關系 抽取 方法 裝置 電子設備 | ||
本發明提供了一種語義實體關系抽取方法、裝置及電子設備,該方法涉及人工智能與自然語言處理的信息抽取技術領域,該方法包括:識別出輸入文本的每個詞節點;構建每個詞節點的依存特征;當有兩個以上詞節點為并列關系時,通過遞歸調用預存的語義規則,抽取出候選節點的關系三元組;其中,預存的語義規則包括前修飾結構規則和動詞相關規則。與現有技術相比,本發明利用遞歸方法,避免了因規則復雜、定義不全而發生抽取遺漏的情況,能夠提高實體關系抽取的準確率。
技術領域
本發明涉及人工智能與自然語言處理的信息抽取技術領域,尤其是涉 及一種語義實體關系抽取方法、裝置及電子設備。
背景技術
信息抽取技術可以將大量文本中蘊含的無結構化信息以結構化或者半 結構化的形式輸出,快速獲取用戶關心的信息,廣泛應用于知識圖譜、智 能搜索引擎、自動問答系統、文本挖掘、機器翻譯等許多人工智能領域。
目前,傳統有監督、非開放式實體關系抽取方法需要大規模人工標注 語料庫用于模型訓練,只能抽取預先定義的關系類型,并且基于特定領域, 普遍適用性差。現有的無監督、開放式實體關系抽取方法通過對文本進行 預處理、命名實體識別和依存句法分析,獲得實體對對應的依存路徑,與 依存語義范式集的范式進行匹配,若匹配成功則輸出關系三元組。
但是現有技術對并列關系的抽取依靠范式匹配,可能會因規則復雜、 定義不全而發生抽取遺漏的情況,導致實體關系的抽取存在準確率較低的 技術問題。
發明內容
有鑒于此,本發明的目的在于提供一種語義實體關系抽取方法、裝置 及電子設備,以避免因規則復雜、定義不全而發生抽取遺漏的情況,能夠 提高實體關系抽取的準確率。
第一方面,本發明實施例提供了一種語義實體關系抽取方法,該方法 包括:
識別出輸入文本的每個詞節點;
構建每個詞節點的依存特征;
當有兩個以上詞節點為并列關系時,通過遞歸調用預存的語義規則, 抽取出候選節點的關系三元組;
其中,所述預存的語義規則包括前修飾結構規則和動詞相關規則。
結合第一方面,本發明實施例提供了第一方面的第一種可能的實施方 式,其中,所述依存特征包括:候選節點的依存路徑和子節點依存路徑字 典。
結合第一方面,本發明實施例提供了第一方面的第二種可能的實施方 式,其中,所述當有兩個以上詞節點為并列關系時,通過遞歸調用預存的 語義規則,抽取出候選節點的關系三元組,具體包括:
當有兩個以上詞節點為并列關系時,判斷所述依存特征的關系類型;
所述關系類型為事件關系時,對每個動詞候選節點先抽取主語,再通 過遞歸調用預存的主謂動賓結構規則或主謂介賓結構規則,抽取與主語相 關的多組謂語和賓語,構成多組關系三元組;
所述關系類型為事實關系時,對每個實體候選節點先抽取前修飾詞, 再通過遞歸調用預存的前修飾結構規則,抽取與前修飾詞相關的多組關系 詞和關系實體,構成多組關系三元組。
結合第一方面,本發明實施例提供了第一方面的第三種可能的實施方 式,其中,所述事件關系包括:動詞相關類結構,其中,動詞相關類結構 包括主謂動賓結構,以及主謂介賓結構。
所述事實關系包括:前修飾類結構,其中,前修飾類結構包括組合式 定語結構,以及由結構助詞“的”與中心語連接的結構。
結合第一方面,本發明實施例提供了第一方面的第四種可能的實施方 式,所述事實關系還包括:謂語為“是”或“是”的同義詞的主謂動賓結 構。
結合第一方面,本發明實施例提供了第一方面的第五種可能的實施方 式,其中,在所述識別出輸入文本的每個詞節點之后,還包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東蔚海數問大數據科技有限公司,未經廣東蔚海數問大數據科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810633241.8/2.html,轉載請聲明來源鉆瓜專利網。





