[發明專利]用于文件圖像數據庫的導航方法無效
| 申請號: | 98124346.0 | 申請日: | 1998-09-24 |
| 公開(公告)號: | CN1101969C | 公開(公告)日: | 2003-02-19 |
| 發明(設計)人: | 約翰·F·卡倫;喬納森·J·赫爾 | 申請(專利權)人: | 株式會社理光 |
| 主分類號: | G06T7/00 | 分類號: | G06T7/00 |
| 代理公司: | 北京市柳沈律師事務所 | 代理人: | 黃小臨 |
| 地址: | 日本*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 文件 圖像 數據庫 導航 方法 | ||
技術領域
本發明涉及文件管理系統,特別是提供一種通過一個文件圖像數據庫導航(navigating)的方法。
背景技術
文件圖像的低成本、大容量電存儲的增加使得用戶在電子信息聯機時不斷保存以前以硬拷貝格式存儲的數量和種類總是在增加的文件。由于該存儲技術的變革降低了文件存儲的成本,需要更有效的方法通過對眾多聯機文件搜索找到用戶感興趣的一個特定文件或一組文件。
查找感興趣的文件充其量是最基本的。在這些方法中,典型的方法是將文件掃描進計算機,并由一光符號識別(Optical?CharacterRecognition,OCR”)程序將圖像轉變成文本文件。接著,以掃描所有文件的全部文本或由最初將文件分類的一個人仔細選擇后認為是該文件有代表性的一組關鍵字的系統來執行一關鍵字匹配搜索方式。第一步的問題在于,全面瀏覽大量文件時會造成高的搜索成本。第二步的困難在于,不同的人會采用不同的策略來整理文件和檢索。當數據庫內包含的文件的非均勻性增大時,這些傳統搜索方法的可靠性就會降低。
認識到有機會開發文件圖像部分的信息內容,進行了幾種根據文件中包含的小圖像的匹配對文件進行搜索的嘗試。例如,M.Y.Jaisimha、A.Bruce和T.Nguyen在他們的著作“文件瀏覽:一種用于對退化文件圖像數據的文本和圖像查詢的系統(DocBrowse:A?System?for?Textual?andGraphical?Querying?on?Degraded?Document?Image?Data)”中描述這樣一個系統,它根據印在信紙上端的公司縮略名搜尋文件。D.Doermann等在“用于智能文件檢索的通用主機的研制(Development?of?a?General?Frameworkfor?Intelligent?Document?Retrieval)”中概括地論述了一個根據圖像描述符的產生和匹配來匹配文件的系統,該圖像描述符描述了一個文件的低級特征和高級結構。使人遺憾的是,該方法要求圖像信息的集中處理,大大地限制了其在大多數商業應用中的使用。
雖然,這一方法通過圖像特征向量提供了文件搜索能力,但是它們沒有提供一種有效的方法來組織一個大的文件圖像數據庫。這些和其他缺點表明,所需要的是一種有效搜索文件圖像數據庫的方法和系統。此方法根據文件圖像的文本以及視覺特性通過組織該數據庫來加快搜索。
發明內容
本發明提供一種交互式數據庫結構和搜索系統,它采用文本搜索和圖像特征提取來自動根據外表將文件組合起來。該系統自動確定文件圖像的視覺特性并根據它們的文件圖像的相對相似性將文件收集起來。
本發明提供一種為特定文件圖像搜索包含多個文件圖像的數據庫的方法,每個文件圖像具有一文本分量、一壓縮表示和一非壓縮表示,所述方法包括以下步驟:接收來自用戶的作為搜索關鍵詞的文本;對所述文件圖像的文本分量進行搜索以尋找所述關鍵詞;將具有包含所述關鍵詞的文本分量的文件圖像組合成基于文件圖像的壓縮表示或非壓縮表示處理的多個文件圖像群;根據所述處理而顯示文件圖像的多個群中的每個的一代表文件圖像;以及接受來自用戶的顯示一特定文件圖像群的輸入。
本發明還提供一種組織數據庫中多個文件圖像的方法,包括以下步驟:壓縮所述多個文件圖像中的每個特定文件圖像;提取有關所述特定文件圖像的圖像特征信息;將所述特定文件圖像組合起來構成文件圖像群;根據處理選擇文件圖像的每個特定群的代表文件圖像;以及顯示每個特定代表文件圖像。
一相關實施例在執行上述的組合步驟之前從壓縮圖像提取特征信息。另一相關實施例還允許用戶指定一期望的群數。
附圖說明
通過參照以下結合下面附圖進行的詳細描述,將更好地理解本發明。
圖1表示一實施本發明的典型計算機系統。
圖2A表示描述本發明一個最佳實施例中的數據庫的典型查詢操作的流程圖。
圖2B表示描述本發明另一個實施例中的數據庫的典型查詢操作的流程圖。
圖3A表示本發明另一個最佳實施例中組織該數據庫的執行步驟的流程圖。
圖3B表示本發明另一個實施例中組織該數據庫的執行步驟的流程圖。
圖4為系統采用壓縮圖像文件以利于低成本存儲和圖像成分的方便操作的示圖。
圖5表示從壓縮圖像提取圖像特征信息作為圖像集合的基礎。
圖6表示從低頻圖像信息提取統計動差(moments)。
圖7表示從高頻圖像信息提取字數和圖像數的連通分量。
圖8表示從高頻圖像信息提取列數的連通分量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于株式會社理光,未經株式會社理光許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/98124346.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:接頭系統
- 下一篇:一種改良雜交稻恢復系抗性的方法
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





