[發明專利]信息抽取方法及裝置、電子設備、存儲介質在審
| 申請號: | 202011038821.6 | 申請日: | 2020-09-27 |
| 公開(公告)號: | CN112131881A | 公開(公告)日: | 2020-12-25 |
| 發明(設計)人: | 張倩汶;閆昭 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F40/295 | 分類號: | G06F40/295;G06N3/04 |
| 代理公司: | 深圳市隆天聯鼎知識產權代理有限公司 44232 | 代理人: | 葉虹 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 信息 抽取 方法 裝置 電子設備 存儲 介質 | ||
本申請的實施例揭示了一種信息抽取方法及裝置,該方法包括:對目標文本進行屬性分類處理,得到與所述目標文本相匹配的關系屬性,所述關系屬性用于表征所述目標文本中包含的實體之間的實體關系;從所述目標文本中抽取與所述實體關系相對應的頭實體;根據所述頭實體和所述實體關系構建實體關系問題;在所述目標文本中進行所述實體關系問題所對應答案的抽取,得到與所述實體關系問題中的頭實體以及實體關系相對應的尾實體,并基于所述頭實體、所述實體關系以及所述尾實體構成所述目標文本含有的結構化信息。本申請實施例的技術方案對于句法結構復雜的文本具有很好的信息抽取效果,并且可以部署在云服務器中。
技術領域
本申請涉及人工智能技術領域,具體涉及一種信息抽取方法及裝置、電子設備和計算機可讀存儲介質。
背景技術
隨著人工智能技術研究和進步,人工智能技術已在多個領域展開研究和應用,例如在常見的自動駕駛、機器人、智能客服等領域,人工智能技術發揮著越來越重要的價值。人工智能技術也可以與云技術相結合,例如將基于人工智能技術開發的應用軟件或應用接口存儲于云端,以對外提供人工智能處理的業務訪問系統,由此能夠保證應用數據具有較高的隱私性和安全性。
在信息抽取領域,利用人工智能技術可以很方便地將嵌入在文本中的非結構化信息自動提取為形如頭實體,實體關系,尾實體的結構化信息。但是,目前的結構化信息抽取方案對于句法結構單一的文本具有較好的信息抽取效果,但是無法處理復雜場景下的結構化信息抽取,例如在文本中含有的主語具有相應的多個謂語及賓語、文本中含有的賓語具有相應的多個主語及賓語等情況下,采用目前的結構化信息抽取方案無法得到準確的結構化信息。
發明內容
為解決上述技術問題,本申請的實施例提供了一種信息抽取方法及裝置、電子設備和計算機可讀存儲介質。
其中,本申請的實施例所提供的技術方案為:
一種信息抽取方法,包括:對目標文本進行屬性分類處理,得到與所述目標文本相匹配的關系屬性,所述關系屬性用于表征所述目標文本中包含的實體之間的實體關系;從所述目標文本中抽取與所述實體關系相對應的頭實體;根據所述頭實體和所述實體關系構建實體關系問題;在所述目標文本中進行所述實體關系問題所對應答案的抽取,得到與所述實體關系問題中的頭實體以及實體關系相對應的尾實體,并基于所述頭實體、所述實體關系以及所述尾實體構成所述目標文本含有的結構化信息
一種信息抽取裝置,包括:實體關系獲取模塊,配置為對目標文本進行屬性分類處理,得到與所述目標文本相匹配的關系屬性,所述關系屬性用于表征所述目標文本中包含的實體之間的實體關系;頭實體抽取模塊,配置為從所述目標文本中抽取與所述實體關系相對應的頭實體;實體關系問題構建模塊,配置為根據所述頭實體和所述實體關系構建實體關系問題;尾實體抽取模塊,配置為在所述目標文本中進行所述實體關系問題所對應答案的抽取,得到與所述實體關系問題中的頭實體以及實體關系相對應的尾實體,并基于所述頭實體、所述實體關系以及所述尾實體構成所述目標文本含有的結構化信息。
一種電子設備,包括處理器及存儲器,所述存儲器上存儲有計算機可讀指令,所述計算機可讀指令被所述處理器執行時實現如上所述的信息抽取方法。
一種計算機可讀存儲介質,其上存儲有計算機可讀指令,當所述計算機可讀指令被計算機的處理器執行時,使計算機執行如上所述的信息抽取方法。
本申請的實施例所提供的技術方案能夠保證抽取得到的尾實體的準確性,該技術方案也可以快速且準確地得到目標文本中含有的結構化信息,即使在復雜場景下也具有很好的信息抽取效果。
應當理解的是,以上的一般描述和后文的細節描述僅是示例性和解釋性的,并不能限制本申請的范圍。
附圖說明
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011038821.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種石墨烯OLED器件及其制備方法
- 下一篇:一種網絡流量判定方法和系統
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





