[發(fā)明專利]一種知識圖譜的本體創(chuàng)建方法在審
| 申請?zhí)枺?/td> | 202110206766.5 | 申請日: | 2021-02-24 |
| 公開(公告)號: | CN112860913A | 公開(公告)日: | 2021-05-28 |
| 發(fā)明(設計)人: | 李保平;楊建榮;龍磊 | 申請(專利權)人: | 廣州匯通國信科技有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/35;G06F40/279;G06F40/30 |
| 代理公司: | 廣州越華專利代理事務所(普通合伙) 44523 | 代理人: | 楊艷珊 |
| 地址: | 510000 廣東省廣州*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 知識 圖譜 本體 創(chuàng)建 方法 | ||
1.一種知識圖譜的本體創(chuàng)建方法,其特征在于,包括以下步驟:
S1、匯集數(shù)據(jù),匯集待創(chuàng)建知識圖譜所屬范圍內的全部數(shù)據(jù);
S2、采集概念詞,提取步驟S1中匯集的數(shù)據(jù)的概念詞;
S3、總結關系,基于步驟S1中數(shù)據(jù)之間的關系總結概念詞與概念詞之間的概念關系;
S4、自動生成主體,將步驟S2中的概念詞通過步驟S3中的概念關系關聯(lián)后自動生成主體;
S5、驗證主體,選取各個概念詞所屬的代表數(shù)據(jù)代入步驟S4中的主體中,驗證主體是否成立,若主體不成立提示不成立的概念詞和/或概念關系;
S6、手動處理主體,對不成立的概念詞和/或概念關系進行修改,以及對主體進行主觀編輯。
2.根據(jù)權利要求1所述的本體創(chuàng)建方法,其特征在于,所述步驟S2中采集概念詞具體包括:
S21、將步驟S1中的全部數(shù)據(jù)按照數(shù)據(jù)來源進行一級分類,然后將數(shù)據(jù)按照數(shù)據(jù)類型進行二級分類,形成若干個數(shù)據(jù)集;
S22、采用配置有語義搜索引擎的分詞器對文本數(shù)據(jù)進行分詞處理,以提取文本數(shù)據(jù)中的文本數(shù)據(jù)概念詞;
S23、對數(shù)值數(shù)據(jù)按照數(shù)據(jù)來源與對象類相結合的方式歸納總結提取數(shù)值數(shù)據(jù)概念詞,對聲音數(shù)據(jù)按照數(shù)據(jù)來源與對象類相結合的方式歸納總結提取聲音數(shù)據(jù)概念詞,對圖像數(shù)據(jù)按照數(shù)據(jù)來源與對象類相結合的方式歸納總結提取圖像數(shù)據(jù)概念詞。
3.根據(jù)權利要求2所述的本體創(chuàng)建方法,其特征在于,所述步驟S3中總結關系具體包括:
S31、采用配置有語義搜索引擎的分詞器對文本數(shù)據(jù)進行分詞處理,以總結文本數(shù)據(jù)概念詞與文本數(shù)據(jù)概念詞之間的文-文概念關系;
S32、采用語義搜索引擎分別搜索文本數(shù)據(jù)概念詞與數(shù)值數(shù)據(jù)概念詞、文本數(shù)據(jù)概念詞與聲音數(shù)據(jù)概念詞、文本數(shù)據(jù)概念詞與圖像數(shù)據(jù)概念詞、聲音數(shù)據(jù)概念詞與數(shù)值數(shù)據(jù)概念詞、圖像數(shù)據(jù)概念詞與數(shù)值數(shù)據(jù)概念詞、聲音數(shù)據(jù)概念詞與圖像數(shù)據(jù)概念詞、聲音數(shù)據(jù)概念詞與聲音數(shù)據(jù)概念詞、圖像數(shù)據(jù)概念詞與圖像數(shù)據(jù)概念詞之間的文-數(shù)概念關系、文-聲概念關系、文-圖概念關系、聲-數(shù)概念關系、圖-數(shù)概念關系、聲-圖概念關系、聲-聲概念關系、圖-圖概念關系;
S33、根據(jù)數(shù)學、物理、化學原理總結數(shù)值數(shù)據(jù)概念詞與數(shù)值數(shù)據(jù)概念詞之間的數(shù)-數(shù)概念關系。
4.根據(jù)權利要求1所述的本體創(chuàng)建方法,其特征在于,所述步驟S4中自動生成主體具體包括:
S41、將具有概念關系的兩個概念詞通過對應的概念關系組合成一個關系小組;
S42、將所有關系小組中相同的概念詞合并,從而生成主體。
5.根據(jù)權利要求1所述的本體創(chuàng)建方法,其特征在于:所述主體或為樹狀或為網(wǎng)狀或為放射狀結構。
6.根據(jù)權利要求1所述的本體創(chuàng)建方法,其特征在于:所述步驟S5中驗證主體具體包括:從每個概念詞所屬的數(shù)據(jù)集中選取至少三組代表數(shù)據(jù),將代表數(shù)據(jù)代入自動生成的主體中,利用概念關系驗證該概念關系兩邊的概念詞之間是否符合該概念關系;若一個概念詞所屬數(shù)據(jù)集中的代表數(shù)據(jù)與周圍所有概念詞所屬數(shù)據(jù)集中的代表數(shù)據(jù)均不符合對應的概念關系,則該概念詞提取存在問題,提示該概念詞不成立;若一個概念詞所屬數(shù)據(jù)集中的代表數(shù)據(jù)與周圍部分概念詞所屬數(shù)據(jù)集中的代表數(shù)據(jù)不符合對應的概念關系,則提示該概念關系不成立。
7.根據(jù)權利要求1所述的本體創(chuàng)建方法,其特征在于:所述步驟S6中手動處理主體具體包括:
S61、調取不成立的概念詞的數(shù)據(jù)集、與其有概念關系的全部概念詞的數(shù)據(jù)集、及與其有關的概念關系,首先判斷該不成立的概念詞的數(shù)據(jù)集組合是否正確,若數(shù)據(jù)集組合有問題則手動對數(shù)據(jù)集進行重新組合,數(shù)據(jù)集重新組合后人工擬定新的概念詞,若數(shù)據(jù)集合無問題則直接人工擬定新的概念詞,梳理新的概念詞與原不成立的概念詞周圍的概念詞之間的概念關系,替換原本體中不成立的概念詞及其周圍不成立的概念關系;
S62、調取不成立的概念關系兩邊的概念詞的數(shù)據(jù)集,選取數(shù)據(jù)集中對應的數(shù)據(jù)逐對梳理數(shù)據(jù)關系,集合所有梳理的數(shù)據(jù)關系總結出兩個概念詞之間的概念關系,替換原本體中不成立的概念關系。
S63、人工篩除多余的概念詞,并將這些多余的概念詞及其與其他所需概念詞之間的概念關系一同刪除。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州匯通國信科技有限公司,未經(jīng)廣州匯通國信科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110206766.5/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 圖冊創(chuàng)建設備、圖冊創(chuàng)建方法和圖冊創(chuàng)建程序
- 一種使用創(chuàng)建接口來靈活創(chuàng)建對象的方法
- 報告創(chuàng)建系統(tǒng)、報告創(chuàng)建裝置以及報告創(chuàng)建方法
- 文本創(chuàng)建系統(tǒng)、文本創(chuàng)建裝置、文本創(chuàng)建方法
- 文檔創(chuàng)建設備、文檔創(chuàng)建系統(tǒng)及文檔創(chuàng)建方法
- 剪報創(chuàng)建方法和剪報創(chuàng)建系統(tǒng)
- 數(shù)據(jù)創(chuàng)建裝置、數(shù)據(jù)創(chuàng)建方法及數(shù)據(jù)創(chuàng)建程序
- 信息創(chuàng)建方法及信息創(chuàng)建裝置
- 報告創(chuàng)建系統(tǒng)和報告創(chuàng)建方法
- 創(chuàng)建改進的顏色的顏色創(chuàng)建裝置及顏色創(chuàng)建方法





