[發明專利]一種基于圖文語義轉移技術的照片檢索方法在審
| 申請號: | 202110733293.4 | 申請日: | 2021-06-30 |
| 公開(公告)號: | CN113360698A | 公開(公告)日: | 2021-09-07 |
| 發明(設計)人: | 張楠坤 | 申請(專利權)人: | 北京海納數聚科技有限公司 |
| 主分類號: | G06F16/583 | 分類號: | G06F16/583;G06F16/55;G06K19/06 |
| 代理公司: | 北京智沃律師事務所 11620 | 代理人: | 吳志宏 |
| 地址: | 102200 北京市昌平區回*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 圖文 語義 轉移 技術 照片 檢索 方法 | ||
本發明提供一種基于圖文語義轉移技術的照片檢索方法,包括以下步驟:S1:掃描存放有圖片的文件夾,對文件夾進行排序并編號;掃描文件夾中的圖片,對圖片進行排序并編號;S2:對每張圖片進行識別分析,并建立該圖片的標簽;S3:根據標簽內容,實現圖片聚類操作;S4:對檢索內容提取關鍵字,通過關鍵字在聚類集合、標簽中進行檢索,并將得到的檢索結果顯示。本方法是對圖片檢索技術的優化方案,通過圖文語義轉移,自動為圖片生成文本描述并歸類,在用戶檢索時就可以使用文本檢索技術來對圖片完成檢索。
技術領域
本發明涉及一種圖片檢索方法,尤其是涉及一種基于圖文語義轉移技術的照片檢索方法。
背景技術
隨著互聯網應用技術的發展,圖片成為獲取信息的主要來源之一。在互聯網海量信息中,圖片的數量也呈現爆炸式的增長。如何在繁多的圖片中快速、精準的搜索到所需圖片是互聯網應用領域研究的熱點。
傳統的圖片搜索方法是基于文本的搜索,參考了在文獻檢索中常被使用到的關鍵詞檢索技術,該方法需要對圖片相關的文本信息進行關鍵詞的提取和分析,并建立關鍵詞索引。但這種方法往往會因為圖片相關的文本信息與圖片內容差異較大導致檢索結果相關度較低。為了解決基于文本搜索方法的不足,后來又出現了基于圖片內容特征的方法,該方法通過提取圖片的內容特征,包括圖片本身的顏色、紋理、形狀、空間關系等建立特征索引。檢索時需提供一張樣圖,通過提取分析樣圖的內容特征,與已構造的特征索引進行對比,返回在內容特征上相似的圖片。該方法雖然能從圖片本身的特征上進行分析對比,但缺乏圖片表達的語義信息,只能檢索到“形似”的結果,而且對圖片的內容特征進行索引構建有較高的計算要求。因此根據文本描述可以檢索相關內容圖片,是需要解決的問題。
發明內容
本發明提供了一種基于圖文語義轉移技術的照片檢索方法,解決了存儲圖片太多檢索困難的問題,其技術方案如下所述:
一種基于圖文語義轉移技術的照片檢索方法,包括以下步驟:
S1:掃描存放有圖片的文件夾,對文件夾進行排序并編號;掃描文件夾中的圖片,對圖片進行排序并編號;
S2:對每張圖片進行識別分析,并建立該圖片的標簽;
S3:根據標簽內容,實現圖片聚類操作;
S4:對檢索內容提取關鍵字,通過關鍵字在聚類集合、標簽中進行檢索,并將得到的檢索結果顯示。
進一步的,步驟S2中,圖片生成標簽的過程如下所述:
S21:圖片顏色的標簽生成,識別模塊分析圖片的顏色,生成顏色標簽;
S22:圖片人臉識別的標簽生成,識別模塊分析圖片的人臉數量,生成人數標簽;
S23:圖片建筑物識別的標簽生成,識別模塊分析圖片的建筑物,生成建筑物標簽;
S24:圖片車輛識別的標簽生成,識別模塊分析圖片的車輛,生成車輛標簽;
S25:圖片動物識別的標簽生成,識別模塊分析圖片的動物種類以及數量,生成動物標簽;
S26:圖片植物識別的標簽生成,識別模塊分析圖片的植物種類以及數量,生成植物標簽;
S27:圖片文字識別的標簽生成,識別模塊分析圖片的文字,生成文字標簽;
S28:圖片二維碼識別的標簽生成,識別模塊分析圖片的二維碼,生成二維碼標簽。
進一步的,步驟S3中,聚類操作包括以下步驟:
S31:圖片日期聚類,將拍攝圖片時間在同一天的圖片進行聚類,集合名稱設置為日期;
S22:圖片標簽聚類,將標簽重合數到達設定值的圖片進行聚類,集合名稱設置為標簽組合;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京海納數聚科技有限公司,未經北京海納數聚科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110733293.4/2.html,轉載請聲明來源鉆瓜專利網。





