[發明專利]一種基于決策樹的圖像自動標注方法和裝置有效
| 申請號: | 201611122143.5 | 申請日: | 2016-12-08 |
| 公開(公告)號: | CN108182443B | 公開(公告)日: | 2020-08-07 |
| 發明(設計)人: | 楊婉;李青海;簡宋全;鄒立斌 | 申請(專利權)人: | 廣東精點數據科技股份有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/34;G06K9/46;G06F40/284;G06K9/72 |
| 代理公司: | 北京隆源天恒知識產權代理事務所(普通合伙) 11473 | 代理人: | 閆冬 |
| 地址: | 510630 廣東省廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 決策樹 圖像 自動 標注 方法 裝置 | ||
本發明提供了一種基于決策樹的圖像自動標注方法和裝置。該裝置包括:輸入單元、預處理單元、分割提取單元、標注概率計算單元、生成樹單元、詞間相關性計算單元和選擇關鍵詞單元。與現有技術比較本發明的有益效果在于:對于一些獲取的模糊圖像進行修復,使得圖像語義自動標注技術適用范圍更廣;更加全面地提取了圖像底層特征,采用全局特征和局部特征來反映圖像的真實視覺內容,提高圖像語義自動標注的準確性;全局特征采用主成分分析的尺度不變特征,提高運算效率,特別是對于高維圖像;解決了海量圖像集的不可測量性,將圖像標注問題轉化為了分類問題進行標注,提高了傳統模型的標注性能。
技術領域
本發明涉及圖像語義自動標注技術領域,尤其涉及一種基于決策樹的圖像自動標注方法和裝置。
背景技術
隨著互聯網技術的飛速發展,互聯網上每天都有數以百萬的新圖像在增長。而如何根據用戶的需求,在海量圖像中快速有效地檢索出目標圖像是圖像檢索系統的目標。而圖像語義標注則是圖像檢索的準備性的關鍵步驟。通過圖像語義標注就可以將圖像的檢索問題轉化為技術成熟、效率高的文本檢索問題。但是傳統的語義標注是通過人工的方式對每幅圖像進行關鍵詞描述,在現在數據爆炸的時代這種方式顯然是既費時效率又低。基于圖像內容的語義自動標注就是利用計算機自動實現從測試圖像中提取視覺特征,并通過相似性匹配來檢測圖像。自動標注語義技術避免了人工描述的主觀性,也大大提高了工作效率。
然而理想的語義自動標注模型均需要一個可以對任何圖像進行標注的理想訓練集,為了盡可能實現圖像自動標注,所采用的訓練集中圖像數目是非常大的,可以說具有一種不可測量性。在標注過程中為了得到更加準確的標注結果,有時需要對訓練集中所有圖像進行多次運算,包括那些與待標注圖像相關性非常低的圖像,甚至是沒有一點關系的圖像,這無疑增加了運算的代價,給標注結果帶來負面的影響。
鑒于上述缺陷,本發明創作者經過長時間的研究和試驗,最終獲得了本發明。
發明內容
本發明的目的在于提供一種基于決策樹的圖像自動標注方法和裝置用以克服上述技術缺陷。
為實現上述目的,本發明采用的技術方案在于:
一方面提供了一種基于決策樹的圖像自動標注方法,該方法包括以下步驟:
步驟S1:輸入圖像集;
步驟S2:對所述圖像集中的圖像進行預處理;
步驟S3:采用N-cut算法對圖像進行分割,分別對分割后的區域進行視覺特征提取和量化,然后根據量化后的特征信息計算出特征相似性,根據所述特征相似性將圖像的有效區域進行聚類,形成視覺詞元;
步驟S4:統計所述圖像集中的訓練圖像的關鍵詞和視覺詞元信息,利用后驗概率知識對圖像進行初始標注,計算出每個關鍵詞作為所述圖像集中的測試圖像標注的標注概率P(w|I);
步驟S5:根據所述標注概率P(w|I),設立閾值將所述標注概率P(w|I)分為三個部分,生成左子樹和右子樹;
步驟S6:利用詞間相關性計算所述左子樹和右子樹之間的詞間相關性;
步驟S7:將滿足一定條件的關鍵詞再形成新的左子樹和右子樹,選擇所有的左子樹里面的關鍵詞作為待標注圖像的關鍵詞。
較佳的,所述步驟S2包括以下步驟:
步驟S21:對所述圖像集中的所有圖像,包括訓練圖像和測試圖像,進行尺寸大小歸一化;
步驟S22:對所述測試圖像中的模糊圖像利用維納濾波法進行圖像修復;
所述步驟S3包括以下步驟:
步驟S31:采用N-cut算法將所述圖像集中的每幅圖像都進行分割,選擇圖像的有效區域;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東精點數據科技股份有限公司,未經廣東精點數據科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611122143.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種圖像特征提取方法
- 下一篇:基于場景分類的視頻質量診斷的方法及裝置
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





