[發明專利]一種用于遷移學習的訓練樣本標注成本削減方法在審
| 申請號: | 202010879066.8 | 申請日: | 2020-08-27 |
| 公開(公告)號: | CN112016451A | 公開(公告)日: | 2020-12-01 |
| 發明(設計)人: | 曹永鋒;劉大鵬;蘇彩霞;王鵬舉 | 申請(專利權)人: | 貴州師范大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N20/00 |
| 代理公司: | 貴陽中新專利商標事務所 52100 | 代理人: | 李余江;程新敏 |
| 地址: | 550001 貴州*** | 國省代碼: | 貴州;52 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 遷移 學習 訓練 樣本 標注 成本 削減 方法 | ||
本發明公開了一種用于遷移學習的訓練樣本標注成本削減方法,該方法用于對目標任務待標注樣本進行區分處理:對不位于源任務樣本空間內的目標任務樣本要求標注;對位于源任務樣本空間內的目標任務樣本,自動從源任務已標注樣本集合中找到最佳替代。本發明可以減少訓練樣本標注量,避免樣本重復標注,且在不增加標注成本情況下,增加標注樣本量,還可通過調整參數控制實際樣本標注成本。另外,本發明可在壓縮很大標注成本情況下,保持模型性能穩定,并可與任意樣本挑選方法配套使用。同時,本發明也適用于模型需要更新,以及在通用模型基礎上建立個性化模型的應用場景。
技術領域
本發明涉及人工智能的遷移學習領域,尤其涉及一種利用源任務知識和已有標注數據消減目標任務樣本標注成本的方法。
背景技術
目前成功的機器學習模型都極其重視數據,它們的高性能依靠于大量的標注數據。機器學習模型已經成功應用到了已積累或者能夠容易獲取大量標注數據的任務中(如計算機視覺,文本翻譯,語音識別等),然而,更多的應用場景還沒有積累或者不容易獲取大量標注數據。為了應對應用場景分布的長尾,已經學到的任務知識需要可以遷移到新的任務中。
遷移學習的目標是將源任務學得的知識遷移應用到目標任務。在機器學習領域,此處的知識一般體現為機器學習模型(例如深度神經網絡)的結構和模型參數。目前,即使目標任務與源任務很相似,也需要對源任務上訓練得到的機器學習模型結構與模型參數進行有針對性的調適后才可以將其有效應用于目標任務。除了少數情況(例如zero-shot/one-shot/few-shot learning等),模型調試仍需要大量目標任務標注數據。為這些目標任務數據添加標注需要花費大量時間/金錢。
遷移學習中,目標任務與源任務所需知識/技能應部分重合(遷移學習可成功進行的基本條件),即目標任務和源任務在某個公共特征空間內的樣本分布有部分重合(如圖1)。此種情況下,目標任務的采樣樣本(公共特征空間內)中會包含部分同時屬于源任務的樣本,并且此部分樣本所占比例隨著兩個任務的相似程度增大而增大。
實際應用中,源任務樣本標注工作完成在先。在標注目標任務樣本時,如不考慮源任務已有樣本,則會重復標注部分源任務樣本集合中已有的相同/近似的樣本(位于圖1的區域2中的樣本),這部分重復工作造成了成本浪費,且成本浪費隨著兩個任務的相似程度增大而增大。
一種常見做法是將源任務中與目標任務相關的樣本直接作為目標任務的已標注樣本。這樣做可以一次性獲得大量已標注樣本,然而存在以下問題:(1)這些源任務樣本的信息已經包含在目標模型所采用的來自源任務的部分模型和參數之中,再次使用它們進行訓練有些浪費計算資源。(2)沒有解決在標注新目標任務樣本時產生重復標注浪費的問題。(3)來自源任務的標注樣本數量很大時,對目標任務的針對性調適過程幾乎變成了重新訓練新模型。(4)由于源任務與目標任務有差別,大量差別樣本(圖1中區域1內的樣本)會影響對真正目標任務的學習。
模型調試過程中普遍存在的對原有知識的災難性遺忘問題也對樣本標注提出了挑戰。以圖1為例,如果僅標注區域3的樣本對目標模型進行訓練,盡管最初使用了來自源任務的部分模型和參數,模型仍會遺忘區域1和區域2的知識。對于目標任務來說,遺忘區域1的知識不要緊,但不應該遺忘區域2的知識。
本發明給出了解決以上問題的一種方法。其僅挑選位于圖1中區域3的目標任務樣本要求標注,對位于重疊區域2內的樣本,從源任務的已標注訓練樣本集中找到最佳替代。并且,該方法可以根據標注預算,靈活調整人工標注樣本所占的比例,從而平衡標注樣本數據集的標注成本與生成質量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于貴州師范大學,未經貴州師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010879066.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:基于尺度空間的多模態圖像配準方法、裝置和設備
- 下一篇:一種滑動軸承





