[發(fā)明專利]一種領(lǐng)域知識(shí)庫構(gòu)建方法及裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201611220184.8 | 申請(qǐng)日: | 2016-12-26 |
| 公開(公告)號(hào): | CN106650940B | 公開(公告)日: | 2019-01-22 |
| 發(fā)明(設(shè)計(jì))人: | 王書劍;張霞;趙立軍;崔朝輝 | 申請(qǐng)(專利權(quán))人: | 東軟集團(tuán)股份有限公司 |
| 主分類號(hào): | G06N5/02 | 分類號(hào): | G06N5/02;G06F17/27 |
| 代理公司: | 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 李金;王寶筠 |
| 地址: | 110179 遼*** | 國省代碼: | 遼寧;21 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 領(lǐng)域 知識(shí)庫 構(gòu)建 方法 裝置 | ||
本發(fā)明提供一種領(lǐng)域知識(shí)庫構(gòu)建方法及裝置,在獲取當(dāng)前待構(gòu)建領(lǐng)域中的核心概念以及核心概念所在目標(biāo)文本后,可以從目標(biāo)文本中獲取至少一個(gè)非核心概念,并獲取核心概念和非核心概念的相似度,當(dāng)相似度滿足預(yù)設(shè)條件時(shí),判斷非核心概念是否與已存在于待構(gòu)建領(lǐng)域的領(lǐng)域知識(shí)庫中的概念相同,如果否,則將非核心概念保留在待構(gòu)建領(lǐng)域的領(lǐng)域知識(shí)庫中,并將非核心概念作為新的核心概念,獲取新的核心概念所在目標(biāo)文本,返回執(zhí)行從目標(biāo)文本中獲取至少一個(gè)非核心概念的步驟,在獲取到待構(gòu)建領(lǐng)域的知識(shí)庫中的所有概念后,獲取任意兩個(gè)概念間的關(guān)系,從而獲得待構(gòu)建領(lǐng)域的領(lǐng)域知識(shí)庫,實(shí)現(xiàn)待構(gòu)建領(lǐng)域的領(lǐng)域知識(shí)庫的自動(dòng)構(gòu)建。
技術(shù)領(lǐng)域
本發(fā)明屬于信息處理技術(shù)領(lǐng)域,更具體的說,尤其涉及一種領(lǐng)域知識(shí)庫構(gòu)建方法及裝置。
背景技術(shù)
領(lǐng)域知識(shí)庫是領(lǐng)域內(nèi)所包括的概念以及概念間的關(guān)系的集合,其中概念是其所屬領(lǐng)域的知識(shí),可以通過領(lǐng)域內(nèi)的詞條來指示,概念間的關(guān)系是概念間的相似程度,可以通過數(shù)值來表示,如對(duì)于金融領(lǐng)域的領(lǐng)域知識(shí)庫來說,金融、經(jīng)濟(jì)學(xué)和流通等詞條可以作為其所屬領(lǐng)域的領(lǐng)域知識(shí)庫中的概念,隨著信息的發(fā)展,領(lǐng)域知識(shí)庫可以使知識(shí)信息化和有序化,且利用知識(shí)的共享和交流。
目前領(lǐng)域知識(shí)庫的構(gòu)建通常是由領(lǐng)域內(nèi)的專家或從事編輯工作的人員來完成,即通過專家或從事編輯工作的人員將人腦中的知識(shí)轉(zhuǎn)化為計(jì)算機(jī)所能理解的表現(xiàn)形式,例如對(duì)于金融領(lǐng)域的領(lǐng)域知識(shí)庫來說,其構(gòu)建可以由經(jīng)濟(jì)學(xué)家來完成,這樣經(jīng)濟(jì)學(xué)家根據(jù)自己的專業(yè)知識(shí)給出金融領(lǐng)域的概念以及概念間的關(guān)系,從而獲得金融領(lǐng)域的領(lǐng)域知識(shí)庫,但是這種通過人員來構(gòu)建領(lǐng)域知識(shí)庫需要耗費(fèi)大量時(shí)間、精力和成本,后續(xù)再對(duì)領(lǐng)域知識(shí)庫中的內(nèi)容更新時(shí),需要進(jìn)行更新工作的人員對(duì)領(lǐng)域知識(shí)庫中的內(nèi)容有充分了解才能進(jìn)行更新,因此現(xiàn)有這種通過人員來構(gòu)建領(lǐng)域知識(shí)庫的方式不利于領(lǐng)域知識(shí)庫的維護(hù)。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明的目的在于提供一種領(lǐng)域知識(shí)庫構(gòu)建方法及裝置,用于自動(dòng)構(gòu)建任意一個(gè)領(lǐng)域的知識(shí)庫,從而解決由人員手動(dòng)構(gòu)建帶來的問題,具體的技術(shù)方案如下:
本發(fā)明提供一種領(lǐng)域知識(shí)庫構(gòu)建方法,所述方法包括:
獲取當(dāng)前待構(gòu)建領(lǐng)域中的核心概念以及所述核心概念所在目標(biāo)文本;
從所述目標(biāo)文本中獲取至少一個(gè)非核心概念,所述非核心概念為從所述目標(biāo)文本中提取出的位于全量概念集合中的概念,所述全量概念集合為所述待構(gòu)建領(lǐng)域和領(lǐng)域中核心概念和非核心概念的集合;
獲取所述核心概念和所述非核心概念的相似度;
當(dāng)所述核心概念和所述非核心概念的相似度滿足預(yù)設(shè)條件時(shí),判斷所述非核心概念是否與已存在于所述待構(gòu)建領(lǐng)域的領(lǐng)域知識(shí)庫中的概念相同,如果否,則將所述滿足預(yù)設(shè)條件的非核心概念保留在所述待構(gòu)建領(lǐng)域的領(lǐng)域知識(shí)庫中,并將所述非核心概念作為新的核心概念,獲取所述新的核心概念所在目標(biāo)文本,返回執(zhí)行從所述目標(biāo)文本中獲取至少一個(gè)非核心概念的步驟,如果是,則舍棄所述滿足預(yù)設(shè)條件的非核心概念;
在獲取到所述待構(gòu)建領(lǐng)域的領(lǐng)域知識(shí)庫中的所有概念后,獲取任意兩個(gè)概念間的關(guān)系,從而獲得所述待構(gòu)建領(lǐng)域的領(lǐng)域知識(shí)庫,所述所有概念包括所述待構(gòu)建領(lǐng)域的所有核心概念和所有非核心概念。
優(yōu)選的,所述獲取所述核心概念和所述非核心概念的相似度,包括:
當(dāng)所述核心概念為第1次獲取的概念時(shí),獲取所述非核心概念所在目標(biāo)文本,從所述非核心概念所在目標(biāo)文本中獲取位于所述全量概念集合中的至少一個(gè)第一概念,并根據(jù)所述至少一個(gè)第一概念和所述核心概念對(duì)應(yīng)的至少一個(gè)非核心概念,得到所述核心概念和所述非核心概念的相似度;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于東軟集團(tuán)股份有限公司,未經(jīng)東軟集團(tuán)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611220184.8/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 一種專利文本自動(dòng)分析的系統(tǒng)及方法
- 基于知識(shí)的故障恢復(fù)支持系統(tǒng)
- 一種鐵磁諧振故障知識(shí)庫構(gòu)建方法
- 融合知識(shí)庫處理方法和裝置,以及知識(shí)庫管理系統(tǒng)
- 一種基于病理生理路徑的臨床知識(shí)庫系統(tǒng)
- 一種面向網(wǎng)絡(luò)安全的知識(shí)庫構(gòu)建方法
- 基于多知識(shí)庫推理的數(shù)據(jù)匹配決策方法及系統(tǒng)
- 一種語義知識(shí)庫構(gòu)建方法
- 基于人工智能的知識(shí)庫生成方法和智能機(jī)器人應(yīng)答方法
- 知識(shí)點(diǎn)存儲(chǔ)方法、裝置、服務(wù)器及介質(zhì)
- 構(gòu)建墊、實(shí)體圖像構(gòu)建物和構(gòu)建構(gòu)建物支撐件的方法
- 支持松耦合的軟件構(gòu)建方法、系統(tǒng)及該系統(tǒng)的實(shí)現(xiàn)方法
- 版本的構(gòu)建系統(tǒng)及方法
- 工程構(gòu)建系統(tǒng)及其構(gòu)建方法
- 實(shí)例構(gòu)建方法、裝置及軟件系統(tǒng)
- 軟件構(gòu)建方法、軟件構(gòu)建裝置和軟件構(gòu)建系統(tǒng)
- 天花板地圖構(gòu)建方法、構(gòu)建裝置以及構(gòu)建程序
- 一種項(xiàng)目構(gòu)建方法、持續(xù)集成系統(tǒng)及終端設(shè)備
- 并行構(gòu)建的方法、裝置及設(shè)備
- 構(gòu)建肺癌預(yù)測(cè)模型構(gòu)建方法
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





