[發明專利]一種基于決策樹學習的自動圖像標注與翻譯的方法無效
| 申請號: | 200910060241.4 | 申請日: | 2009-08-04 |
| 公開(公告)號: | CN101620615A | 公開(公告)日: | 2010-01-06 |
| 發明(設計)人: | 侯進;張登勝 | 申請(專利權)人: | 西南交通大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06N1/00 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 610031四川省成都市*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 決策樹 學習 自動 圖像 標注 翻譯 方法 | ||
技術領域
本發明涉及數字圖像檢索技術以及機器學習技術領域,尤其涉及 一種基于決策樹學習的自動圖像標注與翻譯的方法。
背景技術
早期,人們是通過手工標注的方式來實現圖像檢索的,但這項工 作耗時又費力,尤其面對大規模的網絡圖像時,顯然它已經無法勝任。 因此,如何快速、有效地實現對圖像的自動語義標注,變得十分有必 要。
自動圖像標注是一個通過計算機系統以說明文字或關鍵字的形 式,給一幅數字圖像自動分配元數據的過程。這種計算機視覺應用技 術用在圖像檢索中,來組織和查找到數據庫中用戶感興趣的圖像。這 種方法被稱之為一種多類圖像分類法,該分類法含有大量的類,它們 和一個詞匯表一樣大。其中最典型的就是圖像分析,它是以提取特征 向量和訓練標注文字的形式應用于機器學習技術中,企圖自動地為新 圖像加以標注。這種方法首先要學習圖像特征和訓練標注之間的相互 關系,然后開發使用機器翻譯來試著翻譯帶有“可視化內容”的文本 詞匯表。
和傳統的基于內容的圖像檢索CBIR(Content-based?Image Retrieval)相比,自動圖像標注的優點在于用戶可以更自然地設定實 現查詢。自動圖像標注的一個方向是采用分類方法,每一個語義概念 被當作一個類別進行分類。代表方法有:支持向量機(Support?Vector Machine,簡稱SVM)方法,貝葉斯點機方法等等。這種方法當語義 概念相當多時會遇到困難。自動圖像標注的另一個方向是建立圖像和 語義概念的統計概率模型。Duygulu等人提出的翻譯模型(Translation Modal,簡稱TM),利用傳統的語言統計翻譯模型將語義概念翻譯為 blobs(區域聚類)。Jeon等人介紹了一種交叉媒體相關模型 (Cross-media?Relevance?Modal,簡稱CMRM),將圖像標注問題看 作跨語言檢索問題,模型通過計算blobs和語義概念的聯合概率進行 圖像標注,獲得了比較好的效果。但是這類概率的方法對語義和圖像 特征的利用比較粗糙,兩者的結合不是很緊密。而且這類方法對圖像 區域聚類結果的好壞比較敏感。自動圖像標注方法是圖像檢索發展的 一個新方向,也是熱門方向,同樣提出自動圖像標注方法的有發明專 利公開號CN1920820A的發明,該發明考慮的是圖像區域子快的重 要性和訓練集中文本的重要性次序,由此來解決詞頻畸形分布的問 題,而標注后的訓練集是否具有可擴展性并未有涉及。
發明內容
鑒于現有技術的以上不足,本發明考慮的目的是研究一種基于決 策樹學習的自動圖像標注與翻譯的方法,使標注后的訓練集具有可擴 展性及魯棒性,來解決訓練圖像數據庫不適應另一個未訓練的圖像數 據庫的問題以及數據庫不完整和有噪聲數據的問題。本發明的目的是 通過如下的手段實現的。
一種基于決策樹(Decision?Tree,簡稱DT)學習的自動圖像標注 與翻譯的方法,以提取特征向量和訓練標注文字的形式使機器完成學 習后自動地為新圖像加以標注,使用機器翻譯帶有可視化內容的文本 詞匯表而實現圖像資料的機器檢索;包括訓練標注圖像集和圖像自動 標注兩部分,其中
(1)所述訓練標注圖像集包括如下步驟:
a)利用圖像分割算法對訓練圖像集分割成子塊區域,提取每個 子塊區域的底層視覺特征;將這些特征數據離散化,然后將訓練標注 圖像集基于底層特征離散值利用聚類算法進行分類,并構造出語義詞 典;
b)將所述底層特征離散值作為DT學習的輸入屬性,利用DT機 器學習法對已構造的詞典,對應預先設定的語義概念進行自我訓練學 習,生成決策樹并獲取相應的決策規則;
(2)所述圖像自動標注包括如下步驟:
a)對于圖像自動標注,將待標注的圖像通過相同的分割算法得 到多個區域;
b)對每個區域進行特征提取、特征值離散化,得到每個區域的特 征屬性值;
c)根據訓練過程中生成的決策規則,將上一步得到的屬性值帶入 到規則中測試,得到對應的語義概念,這個語義概念就作為該待標注 圖像的標注詞。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西南交通大學,未經西南交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910060241.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:高壓智能雙電源控制保護器
- 下一篇:動密封結構





