[發明專利]文檔檢索設備及文檔檢索方法有效
| 申請號: | 200710154724.1 | 申請日: | 2007-09-13 |
| 公開(公告)號: | CN101201840A | 公開(公告)日: | 2008-06-18 |
| 發明(設計)人: | 山本雅仁 | 申請(專利權)人: | 佳能株式會社 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;H04N1/00 |
| 代理公司: | 中國國際貿易促進委員會專利商標事務所 | 代理人: | 李玲 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文檔 檢索 設備 方法 | ||
技術領域
本發明涉及一種用于執行文檔檢索的設備及其方法,更具體地,涉及一種能檢索包含圖像的文檔的設備。
背景技術
近年來,數據存儲方法越來越先進,并且存儲裝置的制造成本也降低了。這樣,可以容易地存儲和管理大量的文檔數據。另外,具有先進的功能和高性能的文件服務器和文檔管理系統已經廣泛使用,并且用于這種服務器設備和系統的群件已經普及。
隨著具有先進的功能和高性能的信息處理設備的發展,諸如復印機、打印機、圖像掃描儀、傳真設備、數碼相機和具有存儲文檔并發送和接收圖像的功能的多功能外設(MFP)等各種圖像處理設備可以在網絡上相互通信。
在網絡連接環境下,在各種信息處理設備和圖像形成設備之間經常發送和接收大量的文檔數據。在這方面,用于在辦公室積極存儲經網絡流動的大量文檔的存儲基礎結構已經投入使用。
日本專利號3486452(美國專利號6,061,150)公開了可以連接至少兩個圖像數據輸出設備的合成圖像形成設備,該合成圖像形成設備能可靠地存儲圖像的副本,而不需要操作者執行特殊的操作。
為了從大量所存儲的文檔中有效地檢索所需的文檔,除了檢索文本文檔以外,提供檢索主要包括圖像的文檔的能力也是重要的。全文本檢索可能不適合于檢索主要包括圖像而不是文本的文檔,例如演示材料和具有大量圖形和圖像的文檔。當利用基于圖像指定的檢索關鍵檢索包括圖像的文檔時,如果只進行全文本檢索,可能就不那么有意義了。
傳統的相似圖像檢索方法使用圖像作為檢索關鍵來檢索相似的圖像。傳統的相似圖像檢索方法根據圖像的邊緣抽取對象(object),以便確定圖像的形狀,并使用多個對象的位置、顏色和相對位置來確定圖像是否是相似的圖像。另一種傳統的相似圖像檢索方法在直方圖中抽取構成整個圖像的主要顏色和顏色模式的組合,并使用該結果確定圖像是否是相似的圖像。
日本專利申請公開號2006-065866(美國專利申請公開號2006/0050985?A1)公開了使用用于計算特征量的算術處理(類似于認知相似性確定處理)的相似圖像檢索方法。
使用圖像檢索方法的文檔檢索并不旨在檢索本身被指定為檢索關鍵的圖像,而是旨在從包括多個圖像的文檔中適當地找到包括被指定為檢索關鍵的圖像的所需文檔。
例如,日本專利申請公開號2002-149659公開了圖書檢索服務方法,在該方法中,用戶提交包括圖書的部分數據(例如,書的一頁的副本)的檢索請求數據,使用所提交的數據檢索圖書數據庫,并將檢索的結果通知給發出請求的用戶。
在日本專利申請公開號2006-065866(美國專利申請公開號US2006/0050985?A1)公開的僅使用圖像檢索方法的方法中,作為檢索結果只找到一個文檔的情況是很少的。在大多數情況下,檢索結果列表包括大量的文檔,其中包括大量的“噪聲”文檔(不是所需的文檔)。
這是因為在大規模存儲基礎結構中,在大多數實際情況下,存在由重新使用或修改相同的圖像而創建的大量文檔。
由模擬連續量表示圖像之間的相似程度。這樣,不同的圖像某種程度上也具有相似性。因此,得到根據圖像檢索執行的文檔檢索的結果作為連續命中率,而不是根據文檔是否完全被命中而得到的離散結果。
因此,通過盡可能精確地縮小(narrow)檢索結果列表來設定詳細的檢索條件,以便只有與所需的文檔基本上相似的文檔被命中是重要的。
由日本專利申請公開號2002-149659公開的方法從部分頁面圖像數據檢索文檔(書),與上述傳統方法相同。然而,日本專利申請公開號2002-149659既沒有公開也沒有暗示通過指定關于文檔中頁面圖像數據包括的模式的條件來以高精度縮小檢索的配置。
發明內容
本發明的一個實施例涉及一種文檔檢索方法,該方法用于通過基于檢索關鍵圖像在文檔中的出現模式設定檢索條件,來根據圖像檢索文檔。
根據本發明的一個方面,一個實施例涉及一種被配置為檢索包括多個圖像成分的文檔的設備。該設備包括:關鍵圖像指定單元,被配置為指定要被用作用于圖像檢索的檢索關鍵的關鍵圖像;模式設定單元,被配置為將與由關鍵圖像指定單元指定的關鍵圖像等同的圖像成分在文檔中出現模式設定為檢索條件;以及文檔檢索單元,被配置為使用由模式設定單元設定的檢索條件檢索文檔。
根據本發明的另一方面,一個實施例涉及一種用于檢索包括多個圖像成分的文檔的方法。該方法包括:指定要被用作用于圖像檢索的檢索關鍵的關鍵圖像;將與指定的關鍵圖像等同的圖像成分在文檔中的出現模式設定為檢索條件;和使用設定的檢索條件檢索文檔。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于佳能株式會社,未經佳能株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200710154724.1/2.html,轉載請聲明來源鉆瓜專利網。





