[發(fā)明專利]一種改進(jìn)的基于領(lǐng)域本體的概念相關(guān)度計(jì)算方法在審
| 申請(qǐng)?zhí)枺?/td> | 201610833721.X | 申請(qǐng)日: | 2016-09-20 |
| 公開(公告)號(hào): | CN106611040A | 公開(公告)日: | 2017-05-03 |
| 發(fā)明(設(shè)計(jì))人: | 金平艷 | 申請(qǐng)(專利權(quán))人: | 四川用聯(lián)信息技術(shù)有限公司 |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30;G06F17/27 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 610054 四川省成*** | 國省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 改進(jìn) 基于 領(lǐng)域 本體 概念 相關(guān) 計(jì)算方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及語義網(wǎng)絡(luò)技術(shù)領(lǐng)域,具體涉及一種改進(jìn)的基于領(lǐng)域本體的概念相關(guān)度計(jì)算方法。
背景技術(shù)
目前,針對(duì)詞語相關(guān)度計(jì)算的研究很多,計(jì)算方法和算法也比較豐富,或是基于詞語共現(xiàn)幾率計(jì)算相關(guān)度,或是根據(jù)詞語語義詞典的相似度來得到相關(guān)度,或是基于維基百科層次結(jié)構(gòu)計(jì)算相關(guān)度。這其中不乏比較經(jīng)典和優(yōu)秀的算法,但也存在著一些問題,例如,這些方法或是不能全面考慮詞語語義,或是未語義概念間的關(guān)聯(lián)關(guān)系的特性分析相關(guān)度。領(lǐng)域本體相對(duì)于計(jì)算機(jī)處理文本,出現(xiàn)地較晚。隨著知識(shí)量的指數(shù)級(jí)增長,很難有哪部語義詞典能夠完整地覆蓋所有范圍。本體作為表示某專業(yè)領(lǐng)域的知識(shí)數(shù)據(jù)庫,其構(gòu)成結(jié)構(gòu)非常清晰,類似于一棵樹,更復(fù)雜的領(lǐng)域本體會(huì)是圖形結(jié)構(gòu)。盡管會(huì)出現(xiàn)圖形結(jié)構(gòu),但是領(lǐng)域本體中存在著非常明顯的層次結(jié)構(gòu)。概念間的相關(guān)度不等同于概念相似度,考慮了基本屬性關(guān)系、路徑距離與路徑數(shù)量、密度與深度等影響因子,也考慮本體中存在的特殊關(guān)聯(lián)關(guān)系,即相關(guān)度不僅受到相似度的影響,還與本體概念間的關(guān)聯(lián)程度有關(guān)。如工業(yè)”與“信息化”在信息化沒有現(xiàn)在如此普及時(shí),工業(yè)領(lǐng)域中還少見信息化這個(gè)概念,但是隨著信息化進(jìn)程的加快,以信息化促進(jìn)工業(yè)化成為時(shí)代口號(hào),為大多數(shù)所接受。為了滿足上述需求,本發(fā)明提供了一種改進(jìn)的基于領(lǐng)域本體的概念相關(guān)度計(jì)算方法。
發(fā)明內(nèi)容
針對(duì)于即考慮了本體間的基本屬性關(guān)系、路徑距離與路徑數(shù)量、密度與深度等影響因子,又考慮本體中存在的特殊關(guān)聯(lián)關(guān)系來計(jì)算本體概念相關(guān)度問題,本發(fā)明提供了一種改進(jìn)的基于領(lǐng)域本體的概念相關(guān)度計(jì)算方法。
為了解決上述問題,本發(fā)明是通過以下技術(shù)方案實(shí)現(xiàn)的:
步驟1:利用七步法或循環(huán)獲取法構(gòu)建專業(yè)領(lǐng)域本體數(shù)據(jù)庫。
步驟2:考慮了本體間的基本屬性關(guān)系、路徑距離與路徑數(shù)量、密度與深度等影響因子計(jì)算兩本體概念(g1,g2)間的相關(guān)度。
步驟3:考慮本體中存在的特殊關(guān)聯(lián)關(guān)系,計(jì)算本體概念(g1,g2)間的相關(guān)度RE關(guān)聯(lián)(g1,g2)。
步驟4:綜合上述步驟2、步驟3,得到本體概念(g1,g2)間的最終相關(guān)度RE最終(g1,g2)
本發(fā)明的有益效果是:
1、為語義擴(kuò)展提供良好的理論基礎(chǔ)。
2、與經(jīng)典相關(guān)度計(jì)算公式對(duì)比。此方法取得了比不考慮關(guān)聯(lián)性的相似度計(jì)算方法取得了更好的效果。
3、為實(shí)現(xiàn)語義擴(kuò)展能夠提高信息檢索的查全率和查準(zhǔn)率提供良好的理論基礎(chǔ)。
附圖說明
圖1為一種改進(jìn)的基于領(lǐng)域本體的概念相關(guān)度計(jì)算方法結(jié)構(gòu)流程圖。
圖2為本體概念領(lǐng)域模塊語義樹形圖。
具體實(shí)施方式
為了解決即考慮了本體間的基本屬性關(guān)系、路徑距離與路徑數(shù)量、密度與深度等影響因子,又考慮本體中存在的特殊關(guān)聯(lián)關(guān)系來計(jì)算本體概念相關(guān)度問題,結(jié)合圖1-圖2對(duì)本發(fā)明進(jìn)行了詳細(xì)說明,其具體實(shí)施步驟如下:
步驟1:利用七步法或循環(huán)獲取法構(gòu)建專業(yè)領(lǐng)域本體數(shù)據(jù)庫。
步驟2:考慮了本體間的基本屬性關(guān)系、路徑距離與路徑數(shù)量、密度與深度等影響因子計(jì)算兩本體概念(g1,g2)間的相關(guān)度,其具體計(jì)算過程如下:
步驟2.1)構(gòu)造基于基本屬性關(guān)系對(duì)兩本體概念(g1,g2)相似度的影響函數(shù)RE屬性(g1,g2)
兩本體概念(g1,g2)相似度與屬性相似度成正比,與屬性權(quán)重也成正比。
路徑為g1→J1→…→Jn→g2
假設(shè)g1、J1、…、Jn、g2的屬性個(gè)數(shù)各為
每個(gè)屬性對(duì)相應(yīng)概念的影響權(quán)重是不同的,按照權(quán)重系數(shù)分別對(duì)概念屬性進(jìn)行排序,對(duì)每個(gè)概念屬性取前i個(gè)屬性權(quán)重值。
這里
即得下列屬性權(quán)重矩陣(n+2)×i:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于四川用聯(lián)信息技術(shù)有限公司,未經(jīng)四川用聯(lián)信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610833721.X/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)





