[發明專利]一種遷移學習分類的方法及裝置在審
| 申請號: | 201710547008.3 | 申請日: | 2017-07-06 |
| 公開(公告)號: | CN107341512A | 公開(公告)日: | 2017-11-10 |
| 發明(設計)人: | 李子彬;劉波;肖燕珊 | 申請(專利權)人: | 廣東工業大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京集佳知識產權代理有限公司11227 | 代理人: | 羅滿 |
| 地址: | 510062 廣東省*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 遷移 學習 分類 方法 裝置 | ||
技術領域
本發明涉及分類學習領域,更具體地說,涉及一種基于聚類的dynmaic-TrAdaboost遷移學習分類的方法及裝置。
背景技術
分類的概念是在已有數據的基礎上學會一個分類函數或構造出一個分類模型,即我們通常所說的分類器(Classifier)。在傳統的分類學習中,主要通過對帶標簽數據組成的數據集進行訓練,得到分類模型,但是實際上,對于帶標簽的數據進行收集的工作十分困難,需要耗費大量的精力和資源。遷移學習則可以通過對源數據集進行處理從而使其向目標數據集進行遷移,遷移后就可以得到需要的數據集,從而解決帶標簽數據缺乏的問題。
現有遷移學習中,主要思想時通過基于boosting算法,自動迭代增大有利的輔助數據集的權重,減少有利性較差的輔助數據集的權重,并將這些帶有權重的數據用于目標數據集的分類,在每次迭代后得到相關域中的分類器。然而隨著迭代的進行,由于迭代中的一些誤差干擾,造成在源域中的權重只會下降,目標域中的權重只會上升,因此,目標域與源域中就會出現兩極分化的現象,使源域在過程中權重下降過快,并且分類器容易過度集中在難以分類的樣本上,而不能集中在容易分類的樣本上。
因此,如何避免權重更新兩極分化的問題,是本領域技術人員需要解決的問題。
發明內容
本發明的目的在于提供一種基于聚類的dynmaic-TrAdaboost遷移學習分類的方法及裝置,以避免權重更新兩極分化的問題。
為實現上述目的,本發明實施例提供了如下技術方案:
一種基于聚類的dynmaic-TrAdaboost遷移學習分類的方法,包括:
S101,利用總數據集得到總數據集的總權重集,并設置第一權重值跟蹤指數,其中所述總數據集為源數據集的帶權重數據與目標數據集的帶權重數據的組合;
S102,在總數據集中調用基分類器,并利用總權重集得到候選的弱分類器;
S103,判斷所述弱分類器是否滿足預設目標分類器條件,若是,則利用所述弱分類器計算得到目標分類器,利用所述目標分類器對未分類數據進行分類,若否,則繼續執行S104;
S104,計算所述弱分類器在目標數據集上的誤差,并利用所述誤差計算得到動態因子;
S105,設置第二權重值跟蹤指數;
S106,利用所述第一權重值跟蹤指數、所述第二權重值跟蹤指數與所述動態因子,更新總權重集;
S107,將更新后的總權重集中的每一個權重與預設閾值進行比較,從更新后的總權重集中刪除小于所述預設閾值的目標權重值,從總數據集中刪除與所述目標權重值對應的數據,得到更新后的總數據集與更新后的總權重集,返回S102。
其中,在所述S101之前,還包括:
對原始訓練集進行篩選,得到總數據集。
其中,所述對原始訓練集進行篩選,得到總數據集,包括:
獲取原始訓練集,其中所述原始訓練集包括原始源數據集與原始目標數據集;
將所述原始訓練集劃分為多個子集,并刪除每個子集中不在一個簇內的數據,得到總數據集。
其中,所述利用總權重集得到候選的弱分類器包括:
利用總權重集計算得到權重矢量;
將所述權重矢量歸一化;
利用歸一化后的權重矢量得到候選的弱分類器。
其中,在所述S102之前,還包括:
清空候選的弱分類器的集合。
一種基于聚類的dynmaic-TrAdaboost遷移學習分類的裝置,包括:
總權重集獲取模塊,利用總數據集得到總數據集的總權重集,并設置第一權重值跟蹤指數,其中所述總數據集為源數據集的帶權重數據與目標數據集的帶權重數據的組合;
弱分類器計算模塊,用于在總數據集中調用基分類器,并利用總權重集得到候選的弱分類器;
判斷模塊,判斷所述弱分類器是否滿足預設目標分類器條件,若是,則利用所述弱分類器計算得到目標分類器,利用所述目標分類器對未分類數據進行分類;
動態因子計算模塊,用于所述弱分類器沒有滿足預設目標分類器條件時,計算所述弱分類器在目標數據集上的誤差,并利用所述誤差計算得到動態因子;
權重值跟蹤指數設置模塊,用于設置第二權重值跟蹤指數;
第一更新模塊,用于利用所述第一權重值跟蹤指數、所述第二權重值跟蹤指數與所述動態因子,更新總權重集;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東工業大學,未經廣東工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710547008.3/2.html,轉載請聲明來源鉆瓜專利網。





