[發明專利]為媒體文件添加標簽方法和使用該方法的系統無效
| 申請號: | 201010127016.0 | 申請日: | 2010-03-18 |
| 公開(公告)號: | CN102193946A | 公開(公告)日: | 2011-09-21 |
| 發明(設計)人: | 劉媛;李滔;徐盈輝;陳義;張磊 | 申請(專利權)人: | 株式會社理光 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京市柳沈律師事務所 11105 | 代理人: | 黃小臨 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 媒體文件 添加 標簽 方法 使用 系統 | ||
1.一種為媒體文件添加標簽的方法,包括:
基于已有的含有標簽的媒體文件的訓練樣本構建標簽的檢測模型,基于所述訓練樣本中標簽的出現頻率提取標簽之間的共存系數;
輸入媒體文件,并從所輸入的媒體文件中提取視覺特征;
獲取所輸入的媒體文件的初始標簽;
基于所述初始標簽和所述訓練樣本中的標簽之間的共存系數獲取候選標簽;
基于所輸入的媒體文件的視覺特征以及共存系數,使用標簽檢測模型從所述候選標簽中選擇能夠描述輸入媒體文件的標簽集合。
2.根據權利要求1所述的為媒體文件添加標簽的方法,其中,所述基于已有的含有標簽的媒體文件的訓練樣本構建標簽的檢測模型的步驟包括:
基于所述訓練樣本形成標簽詞典,并分別收集所述標簽詞典中的每一個具體標簽所屬的訓練樣本;提取所收集的訓練樣本的視覺特征;
基于所收集的訓練樣本以及所述訓練樣本的視覺特征,構建所述具體標簽的檢測模型,其中所構建的檢測模型給出所述具體標簽在一個媒體文件中的存在概率。
3.根據權利要求1所述的為媒體文件添加標簽的方法,其中,所述基于所述訓練樣本中標簽的出現頻率提取標簽之間的共存系數的步驟包括:
針對所有訓練樣本,統計兩個標簽存在于同一媒體文件中的數量,確定標簽兩兩之間的共存頻率;
針對所有訓練樣本,統計其中存在所述兩個標簽兩者和兩者之一的媒體文件的數量或者統計其中存在所述兩個標簽之中的一個標簽的媒體文件的數量;
基于上述統計的媒體文件的數量,獲得所述兩個標簽的共存系數。
4.根據權利要求1所述的為媒體文件添加標簽的方法,其中所述獲取所輸入的媒體文件的初始標簽的步驟可以通過以下方式之一來實現:
用戶主動提供初始標簽;
自動提取所輸入的媒體文件自身攜帶的標簽;
自動提取所輸入的媒體文件自身攜帶的其他信息,并轉化成標簽形式;
利用所輸入的媒體文件攜帶的其他信息,從第三方自動獲取初始標簽。
5.根據權利要求1所述的為媒體文件添加標簽的方法,其中所述視覺特征包括但不限于:
媒體文件的顏色、紋理、邊緣方向等低層特征;
媒體文件的創建環境、創建時間等高層特征。
6.根據權利要求1所述的為媒體文件添加標簽的方法,其中所述使用標簽檢測模型從所述候選標簽中選擇能夠描述輸入媒體文件的標簽集合的步驟包括:
基于所構建的標簽檢測模型,獲得每個候選標簽針對所輸入的媒體文件的存在置信度;
基于所述標簽之間的共存系數,獲取候選標簽的共存系數矩陣,其中矩陣的維度等于候選標簽的數量;
基于所述候選標簽的存在置信度和候選標簽的共存系數矩陣,計算每個標簽的針對所輸入的媒體文件的存在得分,其中標簽存在得分越大,該標簽越能描述所述輸入媒體文件的內容;
基于所述每個標簽的存在得分,對所述候選標簽的存在得分進行排序;以及
基于所述排序結果,選擇適于描述所述輸入媒體文件的一個或多個標簽。
7.根據權利要求1所述的為媒體文件添加標簽的方法,其中所述基于所述初始標簽和所述訓練樣本中的標簽之間的共存系數獲取候選標簽的步驟包括當所述初始標簽為多個時,對應于所述多個初始標簽中的每一個獲取一個候選標簽列表;以及
所述使用標簽檢測模型從所述候選標簽中選擇能夠描述輸入媒體文件的標簽集合的步驟包括:
使用所構建的標簽檢測模型,獲得每個候選標簽列表中的每個候選標簽針對所輸入的媒體文件的存在置信度;
基于每個候選標簽列表中的所述標簽之間的共存系數,獲取相應候選標簽列表中的標簽的共存系數矩陣,其中矩陣的維度等于相應候選標簽列表中的標簽的數量;
基于相應候選標簽列表中的每個標簽的存在置信度和所述標簽的共存系數矩陣,計算相應候選標簽列表中的每個標簽的針對所輸入的媒體文件的存在得分,通過累計相應候選標簽列表中的每個標簽的針對所輸入的媒體文件的存在得分,獲得相應候選標簽列表的組合存在得分;其中候選標簽列表的組合存在得分越大,該候選標簽列表越能描述所述輸入媒體文件的內容;
基于所述候選標簽列表的組合存在得分,對所述候選標簽列表的組合存在得分進行排序;以及
基于所述排序結果,選擇描述所述輸入媒體文件的候選標簽列表。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于株式會社理光,未經株式會社理光許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010127016.0/1.html,轉載請聲明來源鉆瓜專利網。





