[發明專利]一種圖像檢索中基于文本的查詢擴展與排序方法無效
| 申請號: | 201010184725.2 | 申請日: | 2010-05-12 |
| 公開(公告)號: | CN101901249A | 公開(公告)日: | 2010-12-01 |
| 發明(設計)人: | 張玥杰;金城;薛向陽;岑磊;彭琳 | 申請(專利權)人: | 復旦大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 上海正旦專利代理有限公司 31200 | 代理人: | 包兆宜 |
| 地址: | 20043*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 圖像 檢索 基于 文本 查詢 擴展 排序 方法 | ||
1.一種圖像檢索中基于文本的查詢擴展與排序方法,其特征在于包括如下步驟:
(1)預處理與預分析
針對初始查詢,通過預處理完成查詢的分詞與標點符號加標,并基于經過預處理的初始查詢,通過預分析完成禁用詞加標、詞類分析與關鍵詞提取;
(2)詞語語義相似度度量
針對英語詞語語義相似度度量,基于網絡路徑長度與深度來計算語義距離,針對漢語詞語語義相似度度量,基于綜合考慮主類義原相似度、語義表達式相似度與主類義原框架相似度進行計算,同時融入最大匹配規則與義原深度信息;
(3)融合擴展規則的查詢擴展
基于語義網絡知識,同時融合所建立的特定擴展規則,針對源于初始查詢的關鍵詞序列進行語義擴展;
(4)基于評分的檢索結果排序
以搜索引擎返回的檢索結果作為處理對象,基于詞語語義相似度度量評估查詢關鍵詞序列與圖像描述說明之間的“相近程度”,獲取評分,并通過評分算法進行優化,將最終得分作為搜索引擎返回圖像的排序依據。
2.根據權利要求1所述的方法,其特征在于,所述的英語詞語語義相似度度量算法的原型中,建立一種基于同等詞的Lesk擴展算法,進一步擴展詞語語義定義,其中將同等詞定義為某個詞語所屬同義詞集合在WordNet層次結構中的兄弟結點,其中,一個同義詞集合與其所對應的同等詞存在一個公共父結點。
3.根據權利要求1所述的方法,其特征在于,所述的漢語詞語語義相似度度量算法的原型中,以整個語義表達式為基礎,按層次將義原進行劃分,采用最大匹配的方法,單獨考慮主類義原對于概念的直接描述能力;同時,在度量過程中,加入義原深度信息的考慮,其中的概念語義相似度分為如下三個部分計算:
Sim(C1,C2)=w1*P1+w2*P2+w3*P3
其中,P1為兩個概念主類義原之間的相似度;P2為整個語義表達式之間的相似度;P3是針對兩個DEF主類義原框架之間相似度的計算;w1、w2與w3分別為三個部分相似度所對應的權值,應滿足約束條件w1+w2+w3=1且w2>w1,w2>w3。
4.根據權利要求1所述的方法,其特征在于所述的融合擴展規則的查詢擴展其算法步驟采用如下偽代碼描述:
(1)獲得輸入:原始查詢關鍵詞序列;
(2)選擇其某個關鍵詞項;
(3)如果為英語關鍵詞項,查找WordNet的語義網絡文件,獲取其同義詞集Synset;
如果為漢語關鍵詞項,查找HowNet的語義網絡文件,獲取其語義定義DEF;
(4)基于擴展規則,針對英語關鍵詞項的各個Synset,根據語義網絡層次結構中的部分關系,兄弟關系,以及子女關系,尋找相應的近義詞詞集作為擴展詞集;針對漢語關鍵詞項的各個DEF,作以直接匹配擴展;
(5)基于擴展后處理策略,根據圖像庫標注集信息,對擴展詞集進行過濾篩選,獲取優化后的最終擴展詞集;
(6)重復(2)~(5),獲得原始查詢中每個關鍵詞項的擴展詞集進行合并,將其作為與原始查詢相對應的擴展后查詢表達。
5.根據權利要求1所述的方法,其特征在于,所述的基于評分的檢索結果排序算法的原型中,評分算法中標注詞的計算結果附加權重,用于突出圖像中可能的“突出”物體;采用下述公式計算圖像的排序分數:
其中,ki為關鍵詞序列的第i個關鍵詞;tj為圖像標注詞序列的第j個標注詞;Sim(ki,tj)用于計算兩個詞項ki與tj之間的語義相似度;w(j,m)為相關權重,w(j,m)=(m+1-j)2,用于突出標注序列中標注詞項的前后關系;n與m分別是查詢關鍵詞序列與圖像標注詞序列所包含的詞項個數;當圖像標注詞序列中的第一個標注詞權重為m2,則相對于總權重其所占比例為:
該函數是一個遞減函數,隨著圖像標注詞序列的增大,排頭詞的權重影響成線性遞減。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于復旦大學,未經復旦大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010184725.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:空氣過濾器的自潔凈裝置
- 下一篇:一種帶制氧功能的空氣調節器
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





