[發(fā)明專利]層次化語義脈絡文檔查詢方法無效
| 申請?zhí)枺?/td> | 200810237460.0 | 申請日: | 2008-12-30 |
| 公開(公告)號: | CN101770473A | 公開(公告)日: | 2010-07-07 |
| 發(fā)明(設計)人: | 尹文生;陳修國 | 申請(專利權(quán))人: | 華中科技大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 430074 湖北*** | 國省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 層次 語義 脈絡 文檔 查詢 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種用于非結(jié)構(gòu)化或半結(jié)構(gòu)化文檔查詢的計算機檢索方法,尤其是用于網(wǎng)頁文檔的查詢。
背景技術(shù)
文檔查詢是科學工作中的重要環(huán)節(jié)。隨著計算機技術(shù)、通信技術(shù)、信息技術(shù)等的飛速發(fā)展,人們可以獲得的文獻資料越來越多,視野變得越來越開闊。然而問題也隨之產(chǎn)生,人們可能不必為資料比較少而發(fā)愁,卻為資料太多很難發(fā)現(xiàn)有用的資料發(fā)愁,人們更關(guān)心如何表達更復雜的文檔查詢要求,如何獲取更深層的知識。因此為用戶提供簡便、直觀、有效、更強能力的查詢方法具有較大意義。
目前常見的商用查詢系統(tǒng)通常提供兩種查詢方式:簡單查詢和高級查詢。簡單查詢一般只需要用戶輸入比較少的關(guān)鍵詞,邏輯關(guān)系比較簡單,而高級查詢則輸入的關(guān)鍵詞比較多,甚至可以定義比較復雜的邏輯關(guān)系。在大多數(shù)情況下,簡單查詢和高級查詢之間的差別一般都不是本質(zhì)上的,常常體現(xiàn)為查詢所使用的關(guān)鍵詞的多少不同,它們之間不存在層次關(guān)系,不容易反映用戶的復雜的查詢意圖。
隨著網(wǎng)絡技術(shù)的發(fā)展,通過網(wǎng)絡所能獲取的文檔將越來越多。目前通用的關(guān)鍵詞查詢技術(shù)雖然簡單有效,但是卻存在以下兩個問題。一個問題是關(guān)鍵詞查詢所獲得的文檔范圍太大,增加了用戶從中篩選的難度,需要消耗用戶更多的時間。另一個問題是關(guān)鍵詞查詢不能表示比較深層的知識,它往往局限于關(guān)鍵詞之間的單層的與或非關(guān)系。
為了解決這些問題,提出了許多方法。例如查詢擴展方法通過同義詞、近義詞、上下義詞的擴展將關(guān)鍵詞查詢中的關(guān)鍵詞進行擴展,擴大查詢范圍。而目前熱門的語義網(wǎng)絡、本體論等則希望能在語義層次上理解文檔和用戶的查詢意圖,然后通過兩者的匹配實現(xiàn)文檔查詢。遺憾的是,由于自然語言極其復雜,這些研究還停留在研究階段,并沒有在常用的商用查詢引擎上出現(xiàn)。
與本發(fā)明比較接近的有:
(1)文獻[1]針對SQL語言中SELECT語句的WHERE子句的要求設計了一個多叉樹,用于輸入查詢的條件,這樣可以構(gòu)成非常復雜的SQL查詢語句,但是這種多叉樹主要應用于管理信息系統(tǒng)的開發(fā),是一種對數(shù)據(jù)庫操作的可視化操作,而不是對非結(jié)構(gòu)化的文檔查詢進行操作。
(2)文獻[2]則不對用戶的查詢請求進行分詞等預處理,而是以語義單元為基本單元進行語義分析,得到語義表達式之后再借助于語義單元之間的關(guān)系進行查詢擴展,向初始查詢中加入相關(guān)的詞或短語。這種查詢最終也歸結(jié)為關(guān)鍵詞查詢,算法比較復雜,不容易表達關(guān)鍵詞之間的復雜關(guān)系,也限于表達關(guān)鍵詞之間的單層關(guān)系。
(3)本發(fā)明人在文獻[3]提出的層次化方法,可以用查詢樹來表達用戶的查詢意圖,但該方法同文獻[1]一樣,是應用在數(shù)據(jù)庫應用系統(tǒng)中,處理的是結(jié)構(gòu)化的數(shù)據(jù)庫表。
(4)本發(fā)明人提出語義脈絡文檔查詢方法,并于2008年12月10日申請發(fā)明專利,但該發(fā)明主要側(cè)重于用語義脈絡進行單條查詢意圖的文檔查詢,沒有考慮層次化,不能表達或?qū)崿F(xiàn)更深層次的文檔查詢或知識獲取[4]。
主要參考文獻:
[1]鄧亞,山嵐,李明。用“多叉樹”構(gòu)造SQL查詢中的wHERE子句——“多叉樹”在VB中的實現(xiàn)及應用[J]。微機發(fā)展,2003,13(7):12-14
[2]李莉,高慶獅。一種基于語義單元的查詢擴展方法。計算機科學,2008,35(2):201-204
[3]Wensheng?Yin,Pinghui?Tu,Xiuguo?Chen,Hengxi?Zhang.Problem?Oriented?Analysis?andDecision?Expert?System?with?Large?Capacity?Knowledge-Base.2008International?Conferenceon?Intelligent?System?and?Knowledge?Engineering,Nov.17-18:32-372008,Xiaman?China
[4]尹文生。語義脈絡文檔查詢方法。專利申請?zhí)枺?00810236750.3,2008年12月10日。
發(fā)明內(nèi)容
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華中科技大學,未經(jīng)華中科技大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200810237460.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





