[發(fā)明專利]一種知識圖譜的本體創(chuàng)建方法在審
| 申請?zhí)枺?/td> | 202110206766.5 | 申請日: | 2021-02-24 |
| 公開(公告)號: | CN112860913A | 公開(公告)日: | 2021-05-28 |
| 發(fā)明(設(shè)計)人: | 李保平;楊建榮;龍磊 | 申請(專利權(quán))人: | 廣州匯通國信科技有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/35;G06F40/279;G06F40/30 |
| 代理公司: | 廣州越華專利代理事務(wù)所(普通合伙) 44523 | 代理人: | 楊艷珊 |
| 地址: | 510000 廣東省廣州*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 知識 圖譜 本體 創(chuàng)建 方法 | ||
本發(fā)明涉及一種知識圖譜的本體創(chuàng)建方法,包括以下步驟:S1、匯集數(shù)據(jù);S2、采集概念詞,提取步驟S1中匯集的數(shù)據(jù)的概念詞;S3、總結(jié)關(guān)系,基于數(shù)據(jù)之間的關(guān)系總結(jié)概念詞與概念詞之間的概念關(guān)系;S4、自動生成主體;S5、驗證主體,驗證主體是否成立,若主體不成立提示不成立的概念詞和/或概念關(guān)系;S6、手動處理主體,對不成立的概念詞和/或概念關(guān)系進行修改,以及對主體進行主觀編輯。有益效果是:能夠從各類型數(shù)據(jù)進行概念詞提取與概念關(guān)系提取,使本體的構(gòu)成全面豐富;在本體生成后進行檢驗,并將不成立的概念詞和/或概念關(guān)系反饋給工作人員,工作人員人工進行修改和編輯處理,以提高生成的本體的準確性和可用性。
技術(shù)領(lǐng)域
本發(fā)明涉及知識圖譜技術(shù)領(lǐng)域,尤其涉及一種知識圖譜的本體創(chuàng)建方法。
背景技術(shù)
知識圖譜在圖書情報界稱為知識域可視化或知識領(lǐng)域映射地圖,是顯示知識發(fā)展進程與結(jié)構(gòu)關(guān)系的一系列各種不同的圖形,用可視化技術(shù)描述知識資源及其載體,挖掘、分析、構(gòu)建、繪制和顯示知識及它們之間的相互聯(lián)系。
知識圖譜,是通過將應(yīng)用數(shù)學、圖形學、信息可視化技術(shù)、信息科學等學科的理論與方法與計量學引文分析、共現(xiàn)分析等方法結(jié)合,并利用可視化的圖譜形象地展示學科的核心結(jié)構(gòu)、發(fā)展歷史、前沿領(lǐng)域以及整體知識架構(gòu)達到多學科融合目的的現(xiàn)代理論。
知識圖譜主要由本體、知識、數(shù)據(jù)構(gòu)成,其中本體作為抽象層面是知識圖譜建立的框架與導向。目前在本體創(chuàng)建過程中,只針對文本數(shù)據(jù)進行知識提取,并且本體構(gòu)建后缺乏質(zhì)檢環(huán)節(jié),容易出現(xiàn)差錯。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服現(xiàn)有技術(shù)存在的以上問題,提供一種知識圖譜的本體創(chuàng)建方法。
為實現(xiàn)上述技術(shù)目的,達到上述技術(shù)效果,本發(fā)明通過以下技術(shù)方案實現(xiàn):
一種知識圖譜的本體創(chuàng)建方法,包括以下步驟:
S1、匯集數(shù)據(jù),匯集待創(chuàng)建知識圖譜所屬范圍內(nèi)的全部數(shù)據(jù);
S2、采集概念詞,提取步驟S1中匯集的數(shù)據(jù)的概念詞;
S3、總結(jié)關(guān)系,基于步驟S1中數(shù)據(jù)之間的關(guān)系總結(jié)概念詞與概念詞之間的概念關(guān)系;
S4、自動生成主體,將步驟S2中的概念詞通過步驟S3中的概念關(guān)系關(guān)聯(lián)后自動生成主體;
S5、驗證主體,選取各個概念詞所屬的代表數(shù)據(jù)代入步驟S4中的主體中,驗證主體是否成立,若主體不成立提示不成立的概念詞和/或概念關(guān)系;
S6、手動處理主體,對不成立的概念詞和/或概念關(guān)系進行修改,以及對主體進行主觀編輯。
其中,所述步驟S2中采集概念詞具體包括:
S21、將步驟S1中的全部數(shù)據(jù)按照數(shù)據(jù)來源進行一級分類,然后將數(shù)據(jù)按照數(shù)據(jù)類型進行二級分類,形成若干個數(shù)據(jù)集;
S22、采用配置有語義搜索引擎的分詞器對文本數(shù)據(jù)進行分詞處理,以提取文本數(shù)據(jù)中的文本數(shù)據(jù)概念詞;
S23、對數(shù)值數(shù)據(jù)按照數(shù)據(jù)來源與對象類相結(jié)合的方式歸納總結(jié)提取數(shù)值數(shù)據(jù)概念詞,對聲音數(shù)據(jù)按照數(shù)據(jù)來源與對象類相結(jié)合的方式歸納總結(jié)提取聲音數(shù)據(jù)概念詞,對圖像數(shù)據(jù)按照數(shù)據(jù)來源與對象類相結(jié)合的方式歸納總結(jié)提取圖像數(shù)據(jù)概念詞。
其中,所述步驟S3中總結(jié)關(guān)系具體包括:
S31、采用配置有語義搜索引擎的分詞器對文本數(shù)據(jù)進行分詞處理,以總結(jié)文本數(shù)據(jù)概念詞與文本數(shù)據(jù)概念詞之間的文-文概念關(guān)系;
S32、采用語義搜索引擎分別搜索文本數(shù)據(jù)概念詞與數(shù)值數(shù)據(jù)概念詞、文本數(shù)據(jù)概念詞與聲音數(shù)據(jù)概念詞、文本數(shù)據(jù)概念詞與圖像數(shù)據(jù)概念詞、聲音數(shù)據(jù)概念詞與數(shù)值數(shù)據(jù)概念詞、圖像數(shù)據(jù)概念詞與數(shù)值數(shù)據(jù)概念詞、聲音數(shù)據(jù)概念詞與圖像數(shù)據(jù)概念詞、聲音數(shù)據(jù)概念詞與聲音數(shù)據(jù)概念詞、圖像數(shù)據(jù)概念詞與圖像數(shù)據(jù)概念詞之間的文-數(shù)概念關(guān)系、文-聲概念關(guān)系、文-圖概念關(guān)系、聲-數(shù)概念關(guān)系、圖-數(shù)概念關(guān)系、聲-圖概念關(guān)系、聲-聲概念關(guān)系、圖-圖概念關(guān)系;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣州匯通國信科技有限公司,未經(jīng)廣州匯通國信科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110206766.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 用于圖譜界面的數(shù)據(jù)處理方法及系統(tǒng)
- 用于內(nèi)容特征圖譜化的特征圖譜布局的服務(wù)器及介質(zhì)
- 圖譜的構(gòu)建方法及裝置、電子設(shè)備
- 信息圖譜構(gòu)建方法、裝置及設(shè)備
- 知識圖譜的完善方法及裝置、數(shù)據(jù)處理方法及裝置
- 一種知識圖譜的構(gòu)建方法、裝置、知識圖譜系統(tǒng)及設(shè)備
- 一種基于知識圖譜的故障判別推理方法
- 一種事件圖譜的匹配方法、裝置、電子設(shè)備及存儲介質(zhì)
- 一種用于創(chuàng)建知識圖譜的計算機設(shè)備
- 一種支持增量實體關(guān)聯(lián)的關(guān)系圖譜計算方法
- 圖冊創(chuàng)建設(shè)備、圖冊創(chuàng)建方法和圖冊創(chuàng)建程序
- 一種使用創(chuàng)建接口來靈活創(chuàng)建對象的方法
- 報告創(chuàng)建系統(tǒng)、報告創(chuàng)建裝置以及報告創(chuàng)建方法
- 文本創(chuàng)建系統(tǒng)、文本創(chuàng)建裝置、文本創(chuàng)建方法
- 文檔創(chuàng)建設(shè)備、文檔創(chuàng)建系統(tǒng)及文檔創(chuàng)建方法
- 剪報創(chuàng)建方法和剪報創(chuàng)建系統(tǒng)
- 數(shù)據(jù)創(chuàng)建裝置、數(shù)據(jù)創(chuàng)建方法及數(shù)據(jù)創(chuàng)建程序
- 信息創(chuàng)建方法及信息創(chuàng)建裝置
- 報告創(chuàng)建系統(tǒng)和報告創(chuàng)建方法
- 創(chuàng)建改進的顏色的顏色創(chuàng)建裝置及顏色創(chuàng)建方法





