[發(fā)明專利]信息存儲的方法及裝置在審
| 申請?zhí)枺?/td> | 202011421906.2 | 申請日: | 2020-12-08 |
| 公開(公告)號: | CN112463986A | 公開(公告)日: | 2021-03-09 |
| 發(fā)明(設(shè)計)人: | 荊小兵;匙朝陽 | 申請(專利權(quán))人: | 北京明略軟件系統(tǒng)有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F40/295 |
| 代理公司: | 青島清泰聯(lián)信知識產(chǎn)權(quán)代理有限公司 37256 | 代理人: | 趙燕 |
| 地址: | 100089 北京市海淀區(qū)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 信息 存儲 方法 裝置 | ||
本發(fā)明公開了一種信息存儲的方法及裝置。該發(fā)明包括:對非結(jié)構(gòu)化文本進(jìn)行命名實體識別得到多個實體標(biāo)簽,將該實體標(biāo)簽中兩兩之間存在關(guān)聯(lián)的實體標(biāo)簽以三元組形式存儲,以本體圖形式對屬性圖中的實體和/或關(guān)系建模表示,形成屬性圖本體圖;依據(jù)該三元組集合中每個三元組的輸出類型,和該屬性本體圖,構(gòu)建三元組映射到屬性圖的目標(biāo)規(guī)則;將該三元組集合中的三元組按照該目標(biāo)規(guī)則映射為屬性圖,并存儲至主題圖譜,對主題圖譜進(jìn)行人工審核,修正后將其同步存儲至知識庫中。采用上述方案,將增量信息轉(zhuǎn)換為三元組,然后映射為屬性圖,形成主題圖譜,存儲至知識庫中,解決了相關(guān)技術(shù)中增量信息存入知識庫的過程中準(zhǔn)確率低,耗費大量資源的問題。
技術(shù)領(lǐng)域
本發(fā)明涉及信息處理領(lǐng)域,具體而言,涉及一種信息存儲的方法及裝置。
背景技術(shù)
相關(guān)技術(shù)中,知識圖譜是實現(xiàn)認(rèn)知智能的關(guān)鍵環(huán)節(jié),知識圖譜構(gòu)建需要考慮構(gòu)建效率、數(shù)據(jù)準(zhǔn)確度、人力成本等諸多因素。屬性圖是一種廣泛使用的圖譜數(shù)據(jù)模型,從非結(jié)構(gòu)化數(shù)據(jù)構(gòu)建屬性圖。基本流程包括知識建模、知識獲取、知識融合和知識存儲;知識獲取是從非結(jié)構(gòu)化數(shù)據(jù),經(jīng)過識別抽取,獲得實體、關(guān)系、屬性數(shù)據(jù);知識融合包括本體層的融合和數(shù)據(jù)層的融合,數(shù)據(jù)層的融合通常按照某種策略,進(jìn)行實體、關(guān)系的合并。
在知識獲取和知識融合的過程中,目前主要是從簡單三元組增量構(gòu)建屬性圖,實現(xiàn)這一步驟自動知識抽取準(zhǔn)確率不足,需要大量人工抽取,增量入圖容易造成數(shù)據(jù)重復(fù)、數(shù)據(jù)污染,導(dǎo)致數(shù)據(jù)質(zhì)量下降。
針對相關(guān)技術(shù)中增量信息存入知識庫的過程中準(zhǔn)確率低,耗費大量資源的問題,目前尚未提出有效的解決方案。
發(fā)明內(nèi)容
本發(fā)明的主要目的在于提供一種信息存儲的方法及裝置,以解決相關(guān)技術(shù)中增量信息存入知識庫的過程你準(zhǔn)確率低,耗費大量資源的問題。
為了實現(xiàn)上述目的,根據(jù)本發(fā)明的一個方面,提供了一種信息存儲的方法。該發(fā)明包括:對非結(jié)構(gòu)化文本進(jìn)行命名實體識別得到多個實體標(biāo)簽,將所述實體標(biāo)簽中兩兩之間存在關(guān)聯(lián)的實體標(biāo)簽以三元組形式存儲,形成三元組集合;以本體圖形式對屬性圖中的實體和/或關(guān)系建模表示,形成屬性圖本體圖;依據(jù)所述三元組集合中每個三元組的輸出類型,和所述屬性本體圖,構(gòu)建三元組映射到屬性圖的目標(biāo)規(guī)則;將所述三元組集合中的三元組按照所述目標(biāo)規(guī)則映射為屬性圖,并存儲至主題圖譜;接收目標(biāo)對象的輸入信號,依據(jù)所述輸入信號修正所述主題圖譜,將修正后的所述主題圖譜上的實體存儲至知識庫中。
為了實現(xiàn)上述目的,根據(jù)本發(fā)明的另一方面,提供了一種信息存儲的裝置。該裝置包括:實體識別模塊,用于對非結(jié)構(gòu)化文本進(jìn)行命名實體識別得到多個實體標(biāo)簽,將所述實體標(biāo)簽中兩兩之間存在關(guān)聯(lián)的實體標(biāo)簽以三元組形式存儲,形成三元組集合;建模模塊,用于以本體圖形式對屬性圖中的實體和/或關(guān)系建模表示,形成屬性圖本體圖;構(gòu)建目標(biāo)規(guī)則模塊,用于依據(jù)所述三元組集合中每個三元組的輸出類型,和所述屬性本體圖,構(gòu)建三元組映射到屬性圖的目標(biāo)規(guī)則;第一存儲模塊,用于將所述三元組集合中的三元組按照所述目標(biāo)規(guī)則映射為屬性圖,并存儲至主題圖譜;第二存儲模塊,用于接收目標(biāo)對象的輸入信號,依據(jù)所述輸入信號修正所述主題圖譜,將修正后的所述主題圖譜上的實體存儲至知識庫中。
通過本發(fā)明,采用以下步驟:對非結(jié)構(gòu)化文本進(jìn)行命名實體識別得到多個實體標(biāo)簽,將所述實體標(biāo)簽中兩兩之間存在關(guān)聯(lián)的實體標(biāo)簽以三元組形式存儲,以本體圖形式對屬性圖中的實體和/或關(guān)系建模表示,形成屬性圖本體圖;依據(jù)所述三元組集合中每個三元組的輸出類型,和所述屬性本體圖,構(gòu)建三元組映射到屬性圖的目標(biāo)規(guī)則;將所述三元組集合中的三元組按照所述目標(biāo)規(guī)則映射為屬性圖,并存儲至主題圖譜,對主題圖譜進(jìn)行人工審核,修正后將其同步存儲至知識庫中。采用上述方案,首先將增量信息轉(zhuǎn)換為三元組,然后映射為屬性圖,形成主題圖譜,存儲至知識庫中,解決了相關(guān)技術(shù)中增量信息存入知識庫的過程中準(zhǔn)確率低,耗費大量資源的問題。
附圖說明
構(gòu)成本發(fā)明的一部分的附圖用來提供對本發(fā)明的進(jìn)一步理解,本發(fā)明的示意性實施例及其說明用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的不當(dāng)限定。在附圖中:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京明略軟件系統(tǒng)有限公司,未經(jīng)北京明略軟件系統(tǒng)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011421906.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種抗菌紡粘非織造布及其制備方法
- 下一篇:一種大片貼膜機(jī)
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





