[發明專利]識別用于機器學習任務的遷移模型在審
| 申請號: | 201910403975.1 | 申請日: | 2019-05-16 |
| 公開(公告)號: | CN110503204A | 公開(公告)日: | 2019-11-26 |
| 發明(設計)人: | P·沃特森;B·博哈塔查爾杰;N·C·考德拉;B·M·貝爾高德瑞;P·都貝;M·R·格拉斯;J·R·肯德爾;霍思宇;M·L·赫爾 | 申請(專利權)人: | 國際商業機器公司 |
| 主分類號: | G06N20/00 | 分類號: | G06N20/00;G06N3/04;G06K9/62 |
| 代理公司: | 11038 中國國際貿易促進委員會專利商標事務所 | 代理人: | 劉玉潔<國際申請>=<國際公布>=<進入 |
| 地址: | 美國*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 計算機可執行組件 存儲器 相似性度量 機器學習 目標機器 評估組件 識別組件 源數據集 遷移 神經網絡模型 處理器操作 存儲計算機 可執行組件 樣本數據 處理器 存儲 關聯 學習 評估 申請 | ||
1.一種計算機實現的方法,包括:
由操作性地耦接到處理器的系統評估源數據集和來自目標機器學習任務的樣本數據集之間的相似性度量;以及
由所述系統基于所述相似性度量識別與所述源數據集相關聯的預訓練的神經網絡模型,以執行所述目標機器學習任務。
2.如權利要求1所述的計算機實現的方法,其中所述評估還包括:
由所述系統使用特征提取器和統計聚合技術來創建所述源數據集的第一向量表示和所述樣本數據集的第二向量表示;以及
由所述系統使用所述關于所述第一向量表示和所述第二向量表示的距離計算技術來評估所述相似性度量。
3.如權利要求2所述的計算機實現的方法,其中,所述距離計算技術選自包括以下各項的組:Kullback-Leibler散度、歐幾里德距離、余弦相似性,曼哈頓距離、明可夫斯基距離、簡森香農距離、卡方距離和杰卡德相似性。
4.如權利要求1所述的計算機實現的方法,還包括由所述系統使用來自所述目標機器學習任務的目標數據集在所述預訓練的神經網絡模型上執行訓練步驟。
5.如權利要求1所述的計算機實現的方法,其中,所述識別包括由所述系統從預先存在的模型庫中識別所述預訓練的神經網絡模型。
6.如權利要求1所述的計算機實現的方法,還包括:
由所述系統評估多個源數據集和所述樣本數據集之間的相似性度量,其中所述源數據集包括在所述多個源數據集內;以及
由所述系統使用所述源數據集和來自所述多個源數據集的第二源數據集生成所述預訓練的神經網絡模型。
7.如權利要求6所述的系統,其中所述源數據集與基于視覺的模型相關聯,并且所述第二源數據集與基于知識的模型相關聯。
8.如權利要求1所述的系統,其中在云計算環境中訪問所述相似性度量。
9.如權利要求2所述的計算機實現的方法,其中所述統計聚合技術選自包括以下各項的組:平均值、碼本、標準偏差和中值平均值。
10.一種系統,包括:
存儲計算機可執行組件的存儲器;以及
執行存儲在所述存儲器中的所述計算機可執行組件的處理器,其中所述計算機可執行組件包括用于實現權利要求1-9之一所述的方法中的步驟的組件。
11.一種計算機程序產品,所述計算機程序產品促進使用預訓練的神經網絡模型來增強目標機器學習任務的性能,所述計算機程序產品包括具有隨其體現的程序指令的計算機可讀存儲介質,所述程序指令能夠由處理器執行以使所述處理器實現權利要求1-9之一所述的方法中的步驟。
12.一種計算機實現的系統,包括用于實現權利要求1-9之一所述的方法中的步驟的裝置。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國際商業機器公司,未經國際商業機器公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910403975.1/1.html,轉載請聲明來源鉆瓜專利網。





