[發明專利]一種基于人工智能的實體關系對識別方法及系統在審
| 申請號: | 201711332925.6 | 申請日: | 2017-12-13 |
| 公開(公告)號: | CN108052501A | 公開(公告)日: | 2018-05-18 |
| 發明(設計)人: | 朱瑾鵬;黃詩劍 | 申請(專利權)人: | 北京數洋智慧科技有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27 |
| 代理公司: | 北京正鼎專利代理事務所(普通合伙) 11495 | 代理人: | 岳亞 |
| 地址: | 100000 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 人工智能 實體 關系 識別 方法 系統 | ||
本發明公開了一種基于人工智能的實體關系對識別方法及系統,通過人工智能的方式,從訓練語料庫中自動分析句子并得到目標關系對應實體,然后結合兩個或多個實體的時間屬性,提取出符合時間屬性的實體關系對,用以具體的語義分析。本實施例的方案,能夠準確識別語句中實體關系對,從而能夠準確分析語句中目標關系的詞語以及短語的實際關系,從而準確識別語句的實際含義,為人工智能開展語義識別奠定基礎。
技術領域
本公開涉及人工智能識別技術領域,具體涉及一種基于人工智能的實體關系對識別方法及系統。
背景技術
隨著科技技術的迅猛發展,數據化時代下的各項數據呈現指數級規模的增長,且數據的形式也逐漸演變的更為復雜化。“數據信息超負荷”和“數據信息泛濫”的現象日益嚴重。
因而,基于人工智能技術,將機器學習方法與規則相結合,抽取實體信息關系的方式,可以有效幫助人們快速提取所需的有用信息,甚至隱含于信息下的隱性信息。
現有技術中,大多數的實體關系抽取主要集中在顯性關系上,對于實體隱性關系的抽取相對較少。
發明內容
鑒于上述問題,提出了本公開以便提供一種克服上述問題或者至少部分地解決上述問題的基于人工智能的實體關系對識別方法及裝置。
根據本公開的一個方面,提供了一種基于人工智能的實體關系對識別方法,其包括:
從訓練語料庫中獲取出現正例的句子,將所述句子解析成鏈接語法解析形式;所述正例為存在目標關系的兩個實體;
將所述鏈接語法解析形式的句子中鏈接符鏈接的兩個實體替換為占位符;根據所述占位符和對應的鏈接符,提取得到正模式;
根據所述正模式,遍歷所述訓練語料庫中句子;當能與所述正模式匹配并同時能夠產生反例的句子的數量小于設定閾值時,保留所述正模式;
將所述訓練語料庫中句子按帶時間屬性實體關系抽取處理,得到帶時間屬性的所述正例;
將所述帶時間屬性的正例與所述正模式匹配,將能夠匹配的所述帶時間屬性的正例中的兩個實體、時間屬性以及所述目標關系作為實體關系對。
所述方法還包括:
將所述訓練語料庫中句子按帶時間屬性實體關系抽取處理,得到帶時間屬性的鏈接語法解析形式;
將所述帶時間屬性的鏈接語法解析形式中的兩個實體替換為占位符,并與所述正模式匹配;
將能夠匹配的對應句子中的所述兩個實體、時間屬性以及所述目標關系作為實體關系對。
所述帶時間屬性實體關系抽取處理,包括:
獲取所述訓練語料庫中的句子,將所述句子解析成鏈接語法解析形式;
根據所述句子的連接語法解析形式,提取目標關系的實體關系;
獲取所有在所述句子中出現過的日期列表;
獲取所述句子中包含在實體關系中的謂語;
獲取所述句子中位于所述日期前的介詞;
檢測在所述句子的主語、謂語與日期前的介詞之間,在鏈接語法結構中是否有一條直接的鏈接;
若是,通過所述句子所包含的與主語、謂語有鏈接的日期,構建新的時間關系;
循環執行上述過程,直到得到所述訓練語料庫中所有符合所述正例的句子。
所述帶時間屬性的正例,用如下方式表示:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京數洋智慧科技有限公司,未經北京數洋智慧科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711332925.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:開放式雞舍種類鑒別系統及方法
- 下一篇:后視鏡駕培系統的使用方法





