[發明專利]一種數據庫構建方法、多媒體文件的檢索方法及裝置在審
| 申請號: | 202111113229.2 | 申請日: | 2021-09-23 |
| 公開(公告)號: | CN113934869A | 公開(公告)日: | 2022-01-14 |
| 發明(設計)人: | 周祥;倪德邁;葉正盛 | 申請(專利權)人: | 阿里云計算有限公司;阿里巴巴(中國)有限公司 |
| 主分類號: | G06F16/432 | 分類號: | G06F16/432;G06F16/14 |
| 代理公司: | 北京博思佳知識產權代理有限公司 11415 | 代理人: | 周嗣勇 |
| 地址: | 310024 浙江省*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據庫 構建 方法 多媒體 文件 檢索 裝置 | ||
本說明書提供一種數據庫的構建方法及多媒體文件的檢索方法。預先針對不同類型的多媒體文件,分別配置對應的語義信息識別模型。針對任一多媒體文件,根據其文件類型確定對應的語義信息識別模型,然后根據所確定的語義信息識別模型的輸入需求,調用相應的特征向量提取算法,得到所述目標多媒體文件特征向量,然后輸入至所確定的語義信息識別模型,得到該特征向量對應的語義信息并將其確定為目標多媒體文件的特征關鍵詞,與目標多媒體文件進行關聯存儲。當獲取到檢索關鍵詞后,將檢索關鍵詞轉換為檢索數據庫對應的查詢語句,并基于查詢語句在檢索數據庫中查詢特征關鍵詞包括檢索關鍵詞的多媒體文件,然后將查詢到的多媒體文件作為檢索結果。
技術領域
本說明書一個或多個實施例涉及信息檢索技術領域,尤其涉及一種數據庫構建方法、多媒體文件的檢索方法及裝置。
背景技術
在相關技術中,檢索圖片、視頻、音頻等多媒體文件時,一般是查找與檢索關鍵詞相關的文字描述,例如多媒體文件的文件名稱、文件描述等。這種檢索方式得到的結果往往依賴于所檢索到的多媒體文件的文字描述,若多媒體文件的實際內容與文件名稱或文件描述不符,那么檢索到的結果也是不相符的(例如,圖片中是蘋果,但文件名稱為香蕉,那么檢索香蕉時,會出現蘋果的圖片)。
進一步的,開始注重多媒體文件實際的內容,出現了基于內容的多媒體文件檢索方式,具體而言,對存儲的所有多媒體文件進行特征提取,得到各個多媒體文件的特征向量,構建知識表達庫或者知識表達算法,檢索時,先根據檢索關鍵詞,將檢索關鍵詞轉換為對應的特征向量,然后與各個多媒體文件的特征向量進行相似度計算,將相似度高的多媒體文件作為檢索結果。
這種檢索方式雖然注重了多媒體文件實際的內容,但檢索效率較慢,且對應的檢索系統需要維護或更新時,效率較低且成本較高(例如,特征向量提取算法進行改進后,對于同一多媒體文件提取的特征向量發生改變,需要重新針對每個多媒體文件提取特征向量,還需要重新構建知識表達庫或算法)。
發明內容
有鑒于此,本說明書一個或多個實施例提供一種數據庫的構建方法、多媒體文件的檢索方法,以及對應的裝置、設備、存儲介質、系統。
為實現上述目的,本說明書一個或多個實施例提供技術方案如下:
根據本說明書一個或多個實施例的第一方面,提出了一種數據庫的構建方法,所述數據庫用于檢索多媒體文件;針對不同類型的多媒體文件,分別配置對應的語義信息識別模型;所述方法包括:
針對任一目標多媒體文件,根據所述目標多媒體的文件類型,確定與該類型對應的語義信息識別模型;
根據所確定的語義信息識別模型的輸入需求,調用相應的特征向量提取算法,得到所述目標多媒體文件特征向量;
將所提取到的特征向量輸入至所確定的語義信息識別模型,得到該特征向量對應的語義信息;
將所得到的語義信息確定為所述目標多媒體文件的特征關鍵詞,并與所述目標多媒體文件進行關聯存儲。
根據本說明書一個或多個實施例的第二方面,提出了一種多媒體文件的檢索方法,所述方法包括:
獲取檢索關鍵詞并將所述檢索關鍵詞轉換為與檢索數據庫對應的查詢語句;所述檢索數據庫基于如上述的檢索數據庫構建方法構建得到;
基于所述查詢語句查詢特征關鍵詞包括所述檢索關鍵詞的多媒體文件;
將查詢得到的多媒體文件確定為檢索結果。
根據本說明書一個或多個實施例的第三方面,提出了一種多媒體文件的檢索系統,
所述系統包括檢索數據庫構建模塊、檢索模塊;針對不同類型的多媒體文件,分別配置對應的語義信息識別模型;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里云計算有限公司;阿里巴巴(中國)有限公司,未經阿里云計算有限公司;阿里巴巴(中國)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111113229.2/2.html,轉載請聲明來源鉆瓜專利網。





