[發明專利]一種基于GAN的數據增強的無監督商標檢索系統及方法在審
| 申請號: | 202010039075.6 | 申請日: | 2020-01-14 |
| 公開(公告)號: | CN111274429A | 公開(公告)日: | 2020-06-12 |
| 發明(設計)人: | 梁觀術;曹江中;戴青云;黃云飛 | 申請(專利權)人: | 廣東工業大學 |
| 主分類號: | G06F16/583 | 分類號: | G06F16/583;G06K9/62;G06N3/04;G06N3/08;G06Q50/18 |
| 代理公司: | 廣州粵高專利商標代理有限公司 44102 | 代理人: | 林麗明 |
| 地址: | 510060 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 gan 數據 增強 監督 商標 檢索系統 方法 | ||
本發明公開了一種基于GAN的數據增強的無監督商標檢索系統,包括GAN數據增強模塊、實例區分模塊、商標檢索模塊。GAN數據增強模塊用于生成商標數據集,擴充訓練集;實例區分模塊用于訓練無監督網絡,提取的商標特征;商標檢索模塊用于計算商標數據庫與待檢索商標特征的相似度量并按照大小進行排序。首先,使用商標數據集來訓練對抗生成網絡。然后,將已訓練完的GAN模塊來生成增強的數據集,并加上原來商標數據集組成新的商標數據集。最后,將新的商標數據集用于訓練實例區分模塊。在商標檢索模塊中,分別將待檢索商標圖像和新的商標數據集通過已訓練好的實例區分模塊提取商標特征。本發明有效地解決了商標檢索中數據標注困難和數據多樣性不足的問題。
技術領域
本發明涉及人工智能領域,特別是涉及一種基于對抗生成網絡的數據增強的無監督商標檢索系統方法。
背景技術
商標作為知識產權的重要組成部分,其保護對企業品牌價值有著深刻的影響。同時,商標在一定程度上象征著商品的質量和商家的信譽。隨著商品經濟的快速發展,無論是商標注冊申請量、商標注冊審查量還是有效注冊商標量的數目都在不斷增加,手工查找相似的商標圖像幾乎是一項不可能完成的工作。因此,商標檢索系統被認為是執法機關處理商標保護案件的有力工具。然而,目前商標申請者從申請新商標到批準需要很長時間,其中大部分時間消耗在于檢索相似商標上,這很大程度影響營業者的經濟利益,因此,一套快速且有效的商標檢索系統對加快商標注冊、防止近似偽造商標以及保護商標權益具有很重要的意義。
目前,商標智能檢索主要有文字和圖像兩種方式。基于文字的商標檢索方法太依賴于人工操作且商標圖像攜帶豐富的信息,僅僅使用文字完整描述一張商標圖像是很有難度的事情,而且在描述商標圖像過程中難免加入主觀性。然而,基于圖像方式在表達商標圖像的特性中具有較大的信息量,能夠很好的描述一張商標圖像。因此,商標的圖像檢索也經常被當作主要的商標智能檢索方式。在商標圖像的智能檢索研究中,主要有兩種主流思路。一種是通過傳統的特征設計方法,例如顏色直方圖,局部二值模式(LBP),GIST,Bag ofVisual Words(Bo VW)),Shape Context,SIFT,SURF,HOG。另一種是基于神經網絡的有監督學習方法。Tursun首次把神經網絡運用于商標檢索上,其檢索的效果明顯驗證優于傳統的方法。實驗結果驗證了神經網絡在商標檢索上是可行的。然而,以上兩種基于圖像的商標檢索方法都存在一定的不足。在傳統的特征設計方法中,由于其特征沒有對商標數據的特性進行學習,所提取的特征往往難以真正表達商標圖像的特征,從而導致檢索性能不足;在神經網絡的特征學習方法中,商標的大數據背景下,商標數據標記和收集的問題也不容忽視,大量數據的標注往往是一項難以完成的任務,并且商標數據具有極其的多樣性潛質,簡單的采樣往往難以覆蓋真實樣本的多樣性,為機器學習系統帶來了一定的學習偏差。
因此,本發明通過無監督特征學習方法解決了商標檢索數據標注難的問題,并且,通過了GAN數據增強方法解決數據不足的問題。
發明內容
為了解決現有技術中數據標記困難和收集不足的問題,本發明提供了一種基于GAN的數據增強的無監督商標檢索方法。
為解決上述技術問題,本發明的技術方案如下:
一種基于GAN(對抗生成網絡)的數據增強的無監督商標檢索系統,包括GAN數據增強模塊、實例區分模塊、商標檢索模塊,其中GAN數據增強模塊用于增強商標數據集,擴充商標訓練集;實例區分訓練模塊用于訓練無監督網絡,得到商標特征提取器;商標檢索模塊用于計算商標數據庫與待檢索商標特征的相似度量,輸出商標的排序結果。
在一種優選方案中,所述的GAN數據增強模塊通過已訓練好的GAN模型來生成商標數據集,并將增強的商標數據集與原來的商標數據集結合在一起,組成新的商標數據庫M。
在一種優選方案中,所述的GAN模型的訓練步驟如下:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東工業大學,未經廣東工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010039075.6/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





