[發明專利]一種基于問題本體的語義標注和檢索方法無效
| 申請號: | 201210079110.2 | 申請日: | 2012-03-23 |
| 公開(公告)號: | CN102629278A | 公開(公告)日: | 2012-08-08 |
| 發明(設計)人: | 蔡廣軍;金芝 | 申請(專利權)人: | 河南科技大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 洛陽公信知識產權事務所(普通合伙) 41120 | 代理人: | 李宗虎 |
| 地址: | 471000 河*** | 國省代碼: | 河南;41 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 問題 本體 語義 標注 檢索 方法 | ||
1.一種基于問題本體的語義標注和檢索方法,其特征在于:選取問題領域作為本體內容構建多層次多領域的問題本體模型,采用投影標注方法實現多個本體對單個檢索對象的標注,以及基于問題本體的語義檢索;具體方法為:
(一)構建問題本體模型:
(1)、確定問題本體的專業領域和范疇,選擇所確定的問題領域作為建模本體的內容,列出問題領域中的概念,并定義構成問題本體模型的三種本體單元,分別為問題本體、導航本體和功能本體;
其中,三種本體單元的定義如下:
問題本體PO:包含了問題中的各個領域,領域的性質,領域間的關系以及相關的公理和約束;
定義:PO={PC,PR,PP,PA}
其中,PC是領域概念的集合,包括功能本體和導航本體,PR是PC內元素之間關系的集合,包括導航本體與功能本體之間的關系和導航本體與導航本體之間的關系,PP是PC內元素的屬性的集合,PA是表示PC,PR,PP相關元素約束的公理的集合;
導航本體NO:可以細分的本體,包含功能本體和代表其它導航本體的領域概念;
定義:NO={NC,NR,NP,NA}
其中,NC表示領域內的普通概念和細分領域的領域概念的集合,領域概念是某一功能本體或其它導航本體的名字,NR表示NC內元素之間的關系,NP表示NC內元素的屬性,NA表示NC,NR,NP相關元素約束的公理的集合;
功能本體SO:只包含不能進一步細化的普通概念,不能再細分的本體;
定義:SO={SC,SR,SP,SA}
其中,SC表示領域SO內的概念的集合,每個概念不再具有子領域,即不與任何領域本體重名,SR表示SC內元素之間的關系,SP表示SC內元素的屬性,SA表示SC,?SR,?SP相關元素約束的公理的集合;
(2)、對選定的問題領域進行逐級分解,?并結合步驟(1)中三種本體單元的定義,構建多層次多領域骨架結構的問題本體模型,具體分解步驟如下:
首先,根據問題特征分解領域和領域的層次;具體是根據公認的分類方式進行領域層次的分解;
其次,根據領域內容的相關性分解;具體是當同一領域存在兩個或多個無關內容時,根據領域內不同部分之間的關系分解,當一個領域內不同部分之間無關則分解為不同部分;
再次,根據領域的一致性進行分解;具體是當單個領域存在沖突或相矛盾的內容,無法進行語義推理時,或者同一概念、同一關系和同一屬性具有不同的語義時,進一步進行分解;
最后,根據領域的復雜性進行分解;具體是根據現實的分類和知識的相關性進行分解,以進一步降低領域的復雜度;
(二)、利用問題本體模型對檢索對象進行語義標注:
(1)、確定要檢索的范圍或內容,從資源庫中選取檢索對象;
(2)、在步驟(一)所構建的問題本體模型基礎上,根據各個領域本體的特征和內容確定與領域總匹配度DGolDeg相關的匹配度的權重及投影規則,計算檢索對象與問題本體模型中各個領域本體的領域總匹配度DGolDeg,并選擇領域總匹配度DGolDeg大于設定的最小匹配度的領域本體,所述領域本體包括導航本體和功能本體;
所述的領域總匹配度DGolDeg表示檢索對象與領域本體的匹配程度,定義如下:
DGolDeg=DComDeg×wi+DNecDeg×wj+DValDeg×wk?+DConDeg×wl
其中,DComDeg為領域完整度,DNecDeg為領域必要度,DValDeg為領域有效度,?DConDeg為領域一致度,wi、wj、wk和wl分別表示領域完整度、領域必要度、領域有效度和領域一致度的權重;
領域完整度DComDeg:表示領域模型包含檢索對象的程度,用檢索對象中可以標注的內容和本體內容的比率衡量,定義如下:??
DComDeg=MC/WC×100%
領域必要度DNecDeg:表示此領域模型對檢索對象的重要程度,用1和可以標注檢索對象的領域模型數的比率衡量,定義如下:
DNecDeg=1/ON×100%
領域有效度DValDeg:表示領域模型對標注檢索對象的有效程度,用可以標注的檢索對象和領域模型標注的內容和領域模型內容的比率衡量,定義如下:
DValDeg=MC/OC×100%
領域一致度DConDeg:表示檢索對象與領域模型的一致程度,用檢索對象中不一致的內容和檢索對象的比率衡量,定義如下:
DConDeg=(1-MC)/WC×100%
其中,WC表示檢索對象的內容,OC表示領域模型的內容,MC表示檢索對象中可以用領域模型標注的內容,NMC表示檢索對象中不能用領域模型標注的或與領域模型不一致的內容,ON表示可以標注檢索對象的領域模型數;
(3)、根據步驟(2)中選擇的投影規則,使用選定的導航本體或者功能本體對檢索對象進行投影標注,實現零到多個本體對單個檢索對象的標注;
(4)、將標注結果以及對檢索對象的引用儲存至標注庫;
(三)、基于問題本體模型的語義檢索:
(1)、用戶輸入需要檢索的內容作為檢索請求,檢索問題本體模型,選定問題本體模型中與檢索請求相關的導航本體和功能本體作為檢索領域本體模型;
(2)、確定檢索請求在步驟(1)選定的檢索領域本體模型中的表示,將表示作為檢索目標,并在標注庫中查找選定各個領域中標注有檢索目標的檢索對象,并計算檢索目標與查找到的檢索對象的總匹配度WGolDeg;
用檢索對象總匹配度WGolDeg表示檢索目標和檢索對象的總匹配度,用檢索對象標注總匹配度和領域總匹配度的加權和來衡量,定義如下:?
WGolDeg=?WAGolDeg×wp+DGolDeg×wq
其中,WAGolDeg為檢索對象標注總匹配度,DGolDeg為領域總匹配度,wp表示檢索內容標注總匹配度的權重,wq表示領域總匹配度的權重;
檢索對象標注總匹配度WAGolDeg表示檢索對象的標注內容與檢索目標總的匹配程度,定義如下:
WAGolDeg=WAComDeg×wm+WANecDeg×wn+WAValDeg×wo
其中,WAComDeg為檢索對象標注完整度,WANecDeg為檢索對象標注必要度,WAValDeg為檢索對象標注有效度,wm、wn和wo分別表示檢索對象標注完整度、檢索對象標注必要度和檢索對象標注有效度的權重;
檢索對象標注完整度WAComDeg表示檢索對象的標注與檢索目標匹配的程度,用檢索對象的標注與檢索目標匹配的內容和檢索目標內容的比率衡量,定義如下:
WAComDeg=WAM/Q×100%
檢索對象標注必要度WANecDeg表示檢索對象標注對檢索目標的重要程度,用1和可以匹配的檢索對象的標注數的比率衡量,定義如下:
WANecDeg=1/MWAN×100%
檢索對象標注有效度WAValDeg表示檢索對象的標注內容對檢索目標的有效程度,用檢索對象標注中與檢索目標匹配的內容和檢索對象的標注內容的比率衡量,定義如下:
WAValDeg=?WAM/WA×100%
其中,Q表示檢索目標的內容,WA表示一個檢索對象W的標注內容,WAM表示檢索對象標注中與檢索目標匹配的內容,MWAN表示可以匹配的檢索對象的標注數;
(3)、根據用戶選取的策略和總匹配度WGolDeg對查找到的檢索對象進行排序,刪減匹配度較低的檢索對象,最后把處理后的檢索結果返回給用戶。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于河南科技大學,未經河南科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210079110.2/1.html,轉載請聲明來源鉆瓜專利網。





