[發明專利]文件關聯性判定系統與方法無效
| 申請號: | 01104101.3 | 申請日: | 2001-02-16 |
| 公開(公告)號: | CN1369839A | 公開(公告)日: | 2002-09-18 |
| 發明(設計)人: | 楊立偉 | 申請(專利權)人: | 意藍科技股份有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F9/46 |
| 代理公司: | 北京紀凱知識產權代理有限公司 | 代理人: | 程偉 |
| 地址: | 臺灣省*** | 國省代碼: | 臺灣;71 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文件 關聯性 判定 系統 方法 | ||
本發明是關于一種文件關聯性判定系統與方法,尤指關于一種先擷取文件中的關鍵詞,再依兩文件的關鍵詞來判定其是否具有關聯性的文件關聯性判定系統與方法。
隨著科技的發展,各種如網頁、電子書或新聞稿等文件的產生與傳播越來越快速,連帶地,各種文件的數量也日益龐大,使得搜尋某種特定內容的文件變得越來越困難。以網際網路為例,若使用者欲在一儲存有上萬筆文件的網站中,找尋所需要的某些特定內容的資料,其勢必需要花費許多的時間與心力在搜集與整理上。
為解決上述問題,在現有技術中,多半是將各種文件以特定的資料結構儲存于一資料庫中,再配合搜尋引擎來協助使用者搜尋其所需的資料。例如,使用者先輸入關鍵字后,搜尋引擎即針對使用者所輸入的關鍵字,于資料庫中搜尋內容中具有此關鍵字的文件。使用者可以運用布林運算的觀念,對關鍵字進行各種的組合,以縮小搜尋的范圍。使用者亦可針對某個搜尋的結果作更進一步的搜尋,例如,再輸入另一關鍵字,以針對第一次搜尋所找到的數百篇文件再次進行篩選。
上述現有技術的缺點,為就算使用者找到了一篇符合其需要的特定文件,此篇特定文件對后續搜尋工作的進行并沒有幫助。換言之,當以關鍵字搜尋的方式找到了數篇后,使用者必須一篇篇檢視其內容,以尋找其需要的文件,而在這個過程中,找到一篇文件并不會加速后續的檢視速度。使用者仍需對后續文件進行撿視,以得知其它文件是否為其所需的文件。
此外,以關鍵字來查詢并不一定就可以查詢到所有的相關聯文件。例如,有可能兩篇文件的主題相近,內客相關聯,然而使用者在搜尋時是以關鍵字來進行搜尋,且兩篇文件中有一篇文件的內容中剛好沒有此關鍵字,這種情況下使用者就只能搜尋到一篇文件,而無法兩篇都搜尋到。若避免此狀況的發生,使用者必須同時輸入多個關鍵字,并以聯集的方式進行搜尋。然而此種作法勢必會搜尋到大量文件,需要花費更多的時間與精力來逐篇篩選。
再者,在某些情況下,使用者是先看到一篇特定文件后,想搜尋與此特定文件具有關聯性的文件。這種情況以新聞網站最為常見。此時,若僅以關鍵字來進行搜索,則使用者必須先桃出此篇特定文件的關鍵字后,再以搜尋引擎來依關鍵字進行搜尋。如此不但非常不便,同時也無法避免前述的兩個搜尋文件時所可能遭遇到的問題。
針對上述問題,本發明的目的為提供一種文件關聯性判定系統與方法,其可判定文件之間的關聯性,進而提升使用者搜尋相關聯文件的速度與效率。
本發明的目的可以通過以下措施來達到:
一種文件關聯性判定系統,其判定一特定文件與一待判定文件之間是否具有關聯性,包含:
一關鍵詞擷取裝置,其擷取該特定文件的至少一特定文件關鍵詞,以構成一特定文件關鍵詞組,該關鍵詞擷取裝置亦擷取該待判定文件的至少一待判定文件關鍵詞,以構成一待判定文件關鍵詞組;以及
一關聯性判定裝置,其是對比該特定文件關鍵詞組與該待判定文件關鍵詞組,并當該特定文件關鍵詞組與該待判定文件關鍵詞組的相似程度到達一預定程度時,判定該待判定文件與該特定文件具有關聯性。
一種文件關聯性判定方法,其判定一特定文件與一待判定文件之間是否具有關聯性,包含:
一特定文件關鍵詞擷取程序,其擷取該特定文件的至少一特定文件關鍵詞,以構成一特定文件關鍵詞組;
一待判定文件關鍵詞擷取程序,其擷取該待判定文件的至少一待判定文件關鍵詞,以構成一待判定文件關鍵詞組;以及
一對比程序,其對比該特定文件關鍵詞組與該待判定文件關鍵詞組,并當該特定文件關鍵詞組與待判定文件關鍵詞組相似程度到達一預定程度時,判定該待判定文件與該特定文件具有關聯性。
為達上述目的,依本發明的文件關聯性判定系統與方法包括一關鍵詞擷取裝置以及一關聯性判定裝置。關鍵詞擷取裝置擷取一特定文件的至少一特定文件關鍵詞,以構成一特定文件關鍵詞組。關鍵詞擷取裝置亦擷取一待判定文件的至少一待判定文件關鍵詞,以構成一待判定文件關鍵詞組。關聯性判定裝置則對比特定文件關鍵詞組與待判定文件關鍵詞組,并當特定文件關鍵詞組與待判定文件關鍵詞組的相似程度到達一預定程度時,判定待判定文件與特定文件具有關聯性。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于意藍科技股份有限公司,未經意藍科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/01104101.3/2.html,轉載請聲明來源鉆瓜專利網。





