[發明專利]存在目標數據集時機器學習算法的自動優化在審
| 申請號: | 202080012884.6 | 申請日: | 2020-02-05 |
| 公開(公告)號: | CN113396368A | 公開(公告)日: | 2021-09-14 |
| 發明(設計)人: | 阿爾伯特·普霍爾·托拉斯;保羅·德·豪爾赫·阿蘭達;弗朗西斯科·賈維爾·馬林·圖爾;馬克·羅馬尼 | 申請(專利權)人: | 優魯格斯股份有限公司 |
| 主分類號: | G05B13/04 | 分類號: | G05B13/04;G05B19/04;G06N20/20;G06T3/00;G06T5/00 |
| 代理公司: | 北京安信方達知識產權代理有限公司 11262 | 代理人: | 姜曉霞;楊明釗 |
| 地址: | 烏拉圭蒙*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 存在 目標 數據 時機 學習 算法 自動 優化 | ||
本發明提供了通過自動地生成訓練數據集來使用機器學習技術傳遞知識的方法、系統和計算機程序產品。基于目標數據集的新訓練數據集自動地生成,并且在機器學習技術中用于對圖像執行任務。主要益處之一是可以將在一個域中學到的知識傳遞到提取數據或標記圖像成本高或根本不可行的另一個域中。這些方法和系統還提供基于圖像目標集的圖像訓練集,這些圖像目標集以更有效的方式擴充數據并且改進訓練集的內容和機器學習技術的預測。
相關申請的交叉引用
本申請要求在2019年2月5日提交的題為“AUTOMATIC OPTIMIZATION OF MACHINELEARNING ALGORITHMS IN THE PRESENCE OF TARGET DATASETS”的美國臨時申請第62/801,534號的優先權,其全部內容通過引用并入本文。
背景
機器學習技術允許我們訓練模型來學習特定任務。為了訓練這種模型,需要具有對應的地面實況(ground truth)的訓練數據集。在給定域中訓練機器學習算法的常用方法是使用來自給定訓練數據集中的所有樣本訓練全局模型,其中,地面實況通常是手動創建或標注的。當任務與圖像相關時,由這些模型在新的、看不見的目標圖像上獲取的輸出在與訓練集相似的圖像一起使用時效果最好,并且在應用于可以與訓練集的圖像很大程度上不相似的不同和相異的圖像時表現出明顯的性能下降。一個優點是在訓練集中具有更多的圖像,使得具有更多相似圖像的概率增加。然而,盡管圖像采集系統不斷地生成越來越多的圖像,但是人工標注或識別圖像內容標簽或提取包含在海量圖像中的圖像數據是困難的,甚至是不可能的。自動標記或提取圖像數據的現有技術嘗試已經表現出具有高預測誤差的差的性能。因此,需要開發新穎有效的工具來自動訓練機器學習算法,以對圖像執行不同類型的任務。
附圖簡述
參考附圖闡述詳細描述。在附圖中,附圖標記最左邊的數字標識附圖標記第一次出現的附圖。在不同附圖中使用相同的附圖標記標識相似或相同的項。
圖1是根據本公開的實施例的基于不同土地利用類別(land use classes)生成圖像的語義分割(semantic segmentation)的示例方法的流程圖。
圖2是根據本公開的實施例的基于具有與目標數據集相似的標記訓練數據集的目標數據集生成訓練集的示例性方法的流程圖。
圖3展示了根據本公開的實施例的使用包括與目標數據集相似的標記訓練數據集的生成的訓練集的示例性方法。
圖4示出了根據本公開的實施例的基于具有預測為具有高置信度的目標圖像塊的目標數據集生成訓練集的示例性方法的另一流程圖。
圖5展示了根據本公開的實施例的基于包括與目標數據集相似的標記訓練數據集和預測為具有高置信度的目標圖像塊的目標數據集來生成和使用生成的訓練集的示例性方法。
圖6展示了根據本公開的實施例的具有光學/捕獲系統和控制模塊的基于衛星的成像系統,該控制模塊生成訓練集并且訓練機器學習算法以自動識別和分類圖像中包含的土地類型。
圖7展示了根據本公開的實施例的具有相機和控制模塊的UAV系統,該控制模塊被配置為生成訓練集并且訓練機器學習算法,以從航空圖像自動地提取數據。
圖中的元件是為了簡單和清楚而展示出的并且沒有按比例繪制。此外,某些動作和/或步驟可以以特定順序描述或描繪,而本領域技術人員將理解實際上并不需要這種關于順序的特定性。
詳細描述
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于優魯格斯股份有限公司,未經優魯格斯股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202080012884.6/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





