[發明專利]識別用于機器學習任務的遷移模型在審
| 申請號: | 201910403975.1 | 申請日: | 2019-05-16 |
| 公開(公告)號: | CN110503204A | 公開(公告)日: | 2019-11-26 |
| 發明(設計)人: | P·沃特森;B·博哈塔查爾杰;N·C·考德拉;B·M·貝爾高德瑞;P·都貝;M·R·格拉斯;J·R·肯德爾;霍思宇;M·L·赫爾 | 申請(專利權)人: | 國際商業機器公司 |
| 主分類號: | G06N20/00 | 分類號: | G06N20/00;G06N3/04;G06K9/62 |
| 代理公司: | 11038 中國國際貿易促進委員會專利商標事務所 | 代理人: | 劉玉潔<國際申請>=<國際公布>=<進入 |
| 地址: | 美國*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 計算機可執行組件 存儲器 相似性度量 機器學習 目標機器 評估組件 識別組件 源數據集 遷移 神經網絡模型 處理器操作 存儲計算機 可執行組件 樣本數據 處理器 存儲 關聯 學習 評估 申請 | ||
本申請涉及識別用于機器學習任務的遷移模型。提供了關于自主地促進選擇一個或多個遷移模型以增強一個或多個機器學習任務的性能的技術。例如,這里描述的一個或多個實施例可以包括一種系統,該系統可以包括可以存儲計算機可執行組件的存儲器。該系統還可以包括處理器,該處理器操作性地耦接到存儲器,并且可以執行存儲在存儲器中的計算機可執行組件。該計算機可執行組件可以包括評估組件,該評估組件可以評估源數據集和來自目標機器學習任務的樣本數據集之間的相似性度量。計算機可執行組件還可以包括識別組件,識別組件可以基于相似性度量識別與源數據集相關聯的預訓練的神經網絡模型,以執行目標機器學習任務。
技術領域
本公開涉及用于機器學習任務的遷移模型的識別,并且更具體 地,涉及自主地識別要被選擇用于遷移學習的一個或多個預訓練的神 經網絡,以增強一個或多個機器學習任務的性能。
背景技術
各種人工智能(“AI”)技術利用深度學習神經網絡模型來執行一 個或多個機器學習任務。模型的準確性取決于用于訓練該模型的數據 量和/或數據類型。例如,用于訓練主題(subject)模型的唯一數據(例 如,非重復數據)越多,主題模型可以變得越準確。然而,許多機器 學習任務具有可用于訓練模型的有限量的數據。另外,在其中大量數 據可用的情況下,訓練模型可能是耗時的。傳統方法試圖通過遷移學 習來解決這些問題,其中利用預先存在的預訓練的模型來分析新數據 集并執行一個或多個期望的機器學習任務。然而,對于給定的新數據 集,識別選擇哪個預訓練的模型用于遷移學習可以直接影響一個或多個期望的機器學習任務的性能。
發明內容
以下呈現發明內容以提供對本發明的一個或多個實施例的基本 理解。本發明內容不旨在識別關鍵或重要元素,或描繪特定實施例的 任何范圍或權利要求的任何范圍。其唯一目的是以簡化形式來呈現概 念,以作為稍后呈現的更詳細描述的序言。在這里描述的一個或多個 實施例中,描述了可以自主地識別要被選擇用于遷移學習的一個或多 個預訓練的神經網絡以增強一個或多個機器學習任務的性能的系統、 計算機實現的方法、裝置和/或計算機程序產品。
根據一個實施例,提供了一種系統。該系統可以包括可以存儲計 算機可執行組件的存儲器。該系統還可以包括處理器,該處理器可操 作地耦接到存儲器,并且可以執行存儲在存儲器中的計算機可執行組 件。計算機可執行組件可以包括評估組件,該評估組件可以評估源數 據集和來自目標機器學習任務的樣本數據集之間的相似性度量。計算 機可執行組件還可以包括識別組件,該識別組件可以基于相似性度量 識別與源數據集相關聯的預訓練的神經網絡模型以執行目標機器學習 任務。
根據一個實施例,提供了一種計算機實現的方法。該計算機實現 的方法可以包括由可操作地耦接到處理器的系統評估源數據集和來自 目標機器學習任務的樣本數據集之間的相似性度量。而且,計算機實 現的方法可以包括由系統基于相似性度量來識別與源數據集相關聯的 預訓練的神經網絡模型以執行目標機器學習任務。
根據一個實施例,提供了一種計算機程序產品,該計算機程序產 品可以促進使用預訓練的神經網絡模型來增強目標機器學習任務的性 能。該計算機程序產品可以包括具有隨其而體現的程序指令的計算機 可讀存儲介質。該計算機指令可以由處理器執行以使處理器由可操作 地耦接到處理器的系統評估源數據集和來自目標機器學習任務的樣本數據集之間的相似性度量。而且,該程序指令還可以使處理器由系統 基于相似性度量識別與源數據集相關聯的預訓練的神經網絡模型以執 行目標機器學習任務。
附圖說明
該專利或申請文件包含至少一幅彩色圖。在請求和支付必要費用 后,專利局將提供具有彩色圖的本專利或專利申請公開的副本。
圖1示出了根據這里描述的一個或多個實施例的示例的非限制性 系統的框圖,該系統可以促進選擇用于遷移學習的一個或多個預訓練 的神經網絡模型,該一個或多個預訓練的神經網絡模型可以增強一個 或多個機器學習任務的性能。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國際商業機器公司,未經國際商業機器公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910403975.1/2.html,轉載請聲明來源鉆瓜專利網。





