[發明專利]借助于初始標記的改善生成經標記的數據的方法在審
| 申請號: | 202011524102.5 | 申請日: | 2020-12-22 |
| 公開(公告)號: | CN113095351A | 公開(公告)日: | 2021-07-09 |
| 發明(設計)人: | A·費耶拉本德;A·布隆澤夫斯基;C·哈斯-舒茨;E·潘塞拉;H·赫特林;J·鄭;J·利特克;M·高爾;R·斯大爾;S·克里希納穆里 | 申請(專利權)人: | 羅伯特·博世有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 中國專利代理(香港)有限公司 72001 | 代理人: | 劉晗曦;劉春元 |
| 地址: | 德國斯*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 借助于 初始 標記 改善 生成 數據 方法 | ||
用于生成針對數據集的標記的方法,該方法包括:提供未標記的數據集,該數據集包括多個未標記的數據;針對所述未標記的數據集的數據生成初始標記;提供該初始標記作為第n個標記,其中n=1;執行迭代過程,其中針對n=1、2、3、...N的每個,所述迭代過程的第n個迭代包括如下步驟:利用經標記的數據集來訓練模型以作為第n個經訓練的模型,其中通過未標記的數據集的數據與第n個標記的組合來給出所述經標記的數據集;在使用第n個經訓練的模型的情況下針對未標記的數據集的未標記的數據來預測第n個經預測的標記;根據至少包括所述第n個經預測的標記的標記集合來確定第(n+1)個標記。
技術領域
本公開涉及一種用于生成針對數據集的標記的方法和所述方法的用于生成訓練數據的應用,其中所述訓練數據用于訓練模型、尤其是神經網絡。
背景技術
機器學習的方法、尤其是利用神經網絡、尤其是深度神經網絡(英文:Deep NeuralNetworks, DNN)進行學習的方法在許多問題情況下相對于常規的、用于模式識別的、未訓練的方法而言明顯占優。幾乎所有這些方法都基于被監督的學習。
被監督的學習需要被注釋的或被標記的數據作為訓練數據。這種注釋在下文中也稱為標記,用作針對優化算法的目標輸出。在此,給每個數據元素分派至少一個標記。
標記的質量可以影響到機器學習方法的經訓練的模型的識別能力(Erkennungsleistung)。從現有技術中已知:手動標記用于訓練機器學習方法的樣本(Stichproben)。
本公開提供一種相對于現有技術而言經改善的用于生成標記的方法。
發明內容
一種實施方式涉及用于生成針對數據集的標記的方法,該方法包括:提供未標記的數據集,所述數據集包括多個未標記的數據;針對未標記的數據集的數據生成初始標記;提供所述初始標記作為第n個標記,其中n=1;執行迭代過程,其中針對n=1、2、3、...N其中的每個而言,迭代過程的第n個迭代包括如下步驟:利用經標記的數據集來訓練模型以作為第n個經訓練的模型,其中通過未標記的數據集的數據與第n個標記的組合來給出經標記的數據集;在使用第n個經訓練的模型的情況下針對未標記的數據集的未標記的數據來預測(pr?dizieren)第n個經預測的標記;根據至少包括第n個經預測的標記的標記集合來確定第(n+1)個標記。
該方法基于:從初始標記出發來改善所述初始標記和生成其他標記并且在迭代方法中逐步改善標記、尤其是標記的質量。在此,充分利用經訓練模型的用于泛化(Generalisierung)的能力和/或經訓練模型的經由迭代而增加的精確度。
利用該方法所生成的標記可以與數據集一起被提供作為經標記的或者經注釋的用于訓練模型、尤其是神經網絡的訓練數據。
未標記的數據集的未標記的數據例如是真實的數據、尤其是傳感器的測量值、尤其是多模態的(multimodal)數據。傳感器根據不完全的、示例性的列舉(Aufz?hlung)可以例如是雷達傳感器、光學攝像機、超聲傳感器、激光雷達傳感器或者紅外傳感器。這種傳感器通常在機動車中或一般而言的機器人中的自主和部分自主的功能中得以應用。
針對最初尚未標記的數據,生成初始標記。本公開的方法的優點是:在該步驟中有錯地生成標記便是足夠的。標記的生成因此可以比較簡單并且因此相對快速且低成本地實現。
然后,初始標記在迭代過程的第一個迭代中作為第一個標記被使用,其中在迭代過程的迭代中執行如下步驟:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于羅伯特·博世有限公司,未經羅伯特·博世有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011524102.5/2.html,轉載請聲明來源鉆瓜專利網。





