[發明專利]為媒體文件添加標簽方法和使用該方法的系統無效
| 申請號: | 201010127016.0 | 申請日: | 2010-03-18 |
| 公開(公告)號: | CN102193946A | 公開(公告)日: | 2011-09-21 |
| 發明(設計)人: | 劉媛;李滔;徐盈輝;陳義;張磊 | 申請(專利權)人: | 株式會社理光 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京市柳沈律師事務所 11105 | 代理人: | 黃小臨 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 媒體文件 添加 標簽 方法 使用 系統 | ||
技術領域
本發明涉及標簽添加方法和使用該方法的系統,并且更具體地,涉及一種為內容文件添加標簽的方法和系統。
背景技術
隨著數字技術的普及,現在已經產生了大量的媒體文件,例如音頻文件、視頻文件、圖片、文本以及其組合文件。大量音視頻文件的出現為人們生動地記錄和保存各種信息帶來了便利。但是,隨著這種媒體文件的大量產生,用戶如何迅速地從這些大量的媒體文件中找到自己所需的文件成為一個問題。為了解決這個問題,人們提出為媒體文件添加能夠描述其內容的文字標簽,從而方便人們通過文字標簽來查找各種媒體文件,這種為媒體文件添加文字標簽的方法稱之為“媒體文件標簽法”,就是一種為圖片、音樂片段以及視頻片段添加關鍵字或關鍵詞(也稱之為標簽)的一種行為。這些標簽可以用于隨后的各種媒體文件相關的應用中,例如用于多媒體管理、多媒體搜索、版權保護以及對象識別等等。
傳統的媒體標簽法采用人力對媒體文件添加標簽,顯然非常地費時費力,面對現今日益增長的媒體文件,單靠人力不可能對每個媒體文件添加標簽。為此,美國專利申請US2008/0229192的發明人就提出了一種通過人機交互為圖像添加標簽的方法。該專利申請從墨跡注釋出發,基于墨跡注釋的結果執行墨跡識別處理,識別結果用于形成與圖像文件相關聯的一個或多個標簽。然而,在實踐中,大多數文件并不包含墨跡注釋,尤其是視頻文件和音頻文件。因此,對于沒有墨跡注釋的文件,該專利申請所披露的技術方案是不能生成任何標簽的。
美國專利20090289942提出一種圖像自動標注技術,該方法首先建立一個標簽詞典,基于標簽詞典收集大量訓練樣本,對標簽詞典中存在的標簽建立圖模型(Graph?Model),通過圖的逐步迭代構建標簽模型,該模型可自動完成對每個媒體文件添加標簽。該專利的技術方案最大的缺陷在于只能處理有限的標簽詞典,對于新輸入的圖像,如果新輸入的圖像含有的標簽在標簽詞典中不存在,則沒有標簽輸出,導致失敗;其次,該方法必須全自動完成,在標注過程中用戶無法將先驗知識傳遞給系統,造成先驗知識的浪費。
發明內容
有鑒于上述問題,本發明提出了一種為媒體文件添加標簽的方法和系統,其能夠以全自動方式或者用戶少量干預的半自動方式,為輸入的媒體文件選擇合適的文字標簽來描述其內容,為后續的媒體文件檢索、管理等實際應用提供有力的支持。
根據本發明的一個方面,提供了一種為媒體文件添加標簽的方法,包括:基于已有的含有標簽的媒體文件的訓練樣本構建標簽的檢測模型,基于所述訓練樣本中標簽的出現頻率提取標簽之間的共存系數;輸入媒體文件,并從所輸入的媒體文件中提取視覺特征;獲取所輸入的媒體文件的初始標簽;以及基于所述初始標簽和所述訓練樣本中的標簽之間的共存系數獲取候選標簽;以及基于所述輸入媒體文件的視覺特征以及共存系數,使用標簽檢測模型從候選標簽中選擇能夠描述輸入媒體文件的標簽集合。
根據本發明的為媒體文件添加標簽的方法,所述基于已有的含有標簽的媒體文件的訓練樣本構建標簽的檢測模型的步驟包括:基于所述訓練樣本形成標簽詞典,并收集所述標簽詞典中一個具體標簽所屬的訓練樣本;提取所收集的訓練樣本的視覺特征;基于所收集的訓練樣本以及所述訓練樣本的視覺特征,構建所述具體標簽的檢測模型,其中所構建的檢測模型給出所述具體標簽在一個媒體文件中的存在概率。
根據本發明的為媒體文件添加標簽的方法,所述基于所述訓練樣本中標簽的出現頻率提取標簽之間的共存系數的步驟包括:針對所有訓練樣本,統計兩個標簽存在于同一媒體文件中的數量,確定標簽兩兩之間的共存頻率;針對所有訓練樣本,統計其中存在所述兩個標簽兩者和兩者之一的媒體文件的數量或者統計其中存在所述兩個標簽之中的一個標簽的媒體文件的數量;基于上述統計的媒體文件的數量,獲得所述兩個標簽的共存系數。
根據本發明的為媒體文件添加標簽的方法,其中所述獲取所輸入的媒體文件的初始標簽的步驟可以通過一下方式之一來實現:用戶主動提供初始標簽、自動提取所輸入的媒體文件自身攜帶的標簽、自動提取所輸入的媒體文件自身攜帶的其他信息,并轉化成標簽形式、利用所輸入的媒體文件攜帶的其他信息,從第三方自動獲取初始標簽。
根據本發明的為媒體文件添加標簽的方法,其中所述視覺特征包括但不限于:媒體文件的顏色、紋理、邊緣方向等低層特征以及媒體文件的創建環境、創建時間等高層特征。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于株式會社理光,未經株式會社理光許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010127016.0/2.html,轉載請聲明來源鉆瓜專利網。





