[發(fā)明專(zhuān)利]用于確定圖像的語(yǔ)義分割和/或?qū)嵗指畹脑O(shè)備和方法在審
| 申請(qǐng)?zhí)枺?/td> | 202211148401.2 | 申請(qǐng)日: | 2022-09-21 |
| 公開(kāi)(公告)號(hào): | CN115861607A | 公開(kāi)(公告)日: | 2023-03-28 |
| 發(fā)明(設(shè)計(jì))人: | C·K·穆馬蒂;J·H·梅岑;R·胡馬赫 | 申請(qǐng)(專(zhuān)利權(quán))人: | 羅伯特·博世有限公司 |
| 主分類(lèi)號(hào): | G06V10/26 | 分類(lèi)號(hào): | G06V10/26;G06V10/764;G06V10/70;G06V10/82;G06N20/00;G06N3/0464 |
| 代理公司: | 中國(guó)專(zhuān)利代理(香港)有限公司 72001 | 代理人: | 浩路;周學(xué)斌 |
| 地址: | 德國(guó)斯*** | 國(guó)省代碼: | 暫無(wú)信息 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 確定 圖像 語(yǔ)義 分割 實(shí)例 設(shè)備 方法 | ||
用于確定表征圖像(
技術(shù)領(lǐng)域
本發(fā)明涉及借助于機(jī)器學(xué)習(xí)系統(tǒng)來(lái)確定輸出信號(hào)的方法、機(jī)器學(xué)習(xí)系統(tǒng)、用于控制致動(dòng)器的控制系統(tǒng)、計(jì)算機(jī)程序、以及機(jī)器可讀存儲(chǔ)介質(zhì)。
現(xiàn)有技術(shù)
可在https://arxiv.org/pdf/2106.14999.pdf在線獲得的2021年6月28日的Mummadi等人的“Test-Time Adaptation to Distribution Shift by ConfidenceMaximization and Input Transformation”公開(kāi)了一種用于測(cè)試時(shí)間適配的方法。
背景技術(shù)
機(jī)器學(xué)習(xí)(ML)系統(tǒng)、尤其是神經(jīng)網(wǎng)絡(luò)在越來(lái)越多的技術(shù)領(lǐng)域中被使用,尤其是用于分析來(lái)自光學(xué)傳感器的傳感器數(shù)據(jù)。
在部署ML系統(tǒng)時(shí),部署之后遇到的數(shù)據(jù)可能不同于用于訓(xùn)練的典型數(shù)據(jù)。在這種情況下,存在域移位(domain shift)(也被稱(chēng)為分布移位)。由于ML系統(tǒng)的性能(例如,分類(lèi)準(zhǔn)確度、或在回歸中確定的連續(xù)值的準(zhǔn)確度)可能會(huì)在域移位之后顯著地惡化,因此設(shè)計(jì)出一種用于使ML系統(tǒng)適配于新的域和/或分布的方法將是合期望的。尤其是在當(dāng)推理期間沒(méi)有針對(duì)新的域和/或分布的可靠標(biāo)注可用時(shí)的情形中,這種適配方法是合期望的。特定情形是“沒(méi)有源的域適配(source-free domain adaptation)”或“測(cè)試時(shí)間適配”,其中該適配純粹是在來(lái)自目標(biāo)域(移位之后的域)的未加標(biāo)簽的數(shù)據(jù)上進(jìn)行的,而不需要最初在其上訓(xùn)練了該網(wǎng)絡(luò)的數(shù)據(jù)(源域)。
發(fā)明內(nèi)容
在第一方面,本發(fā)明涉及一種用于確定表征圖像的語(yǔ)義分割和/或?qū)嵗指畹妮敵鲂盘?hào)(
? 借助于機(jī)器學(xué)習(xí)系統(tǒng)來(lái)確定第一中間輸出信號(hào),其中第一中間輸出信號(hào)表征該圖像的語(yǔ)義分割和/或?qū)嵗指睿?/p>
? 基于損失函數(shù)來(lái)適配該機(jī)器學(xué)習(xí)系統(tǒng)的參數(shù),其中損失函數(shù)表征第一中間輸出信號(hào)的熵或交叉熵;
? 基于該圖像和經(jīng)適配的參數(shù)來(lái)確定來(lái)自該機(jī)器學(xué)習(xí)系統(tǒng)的輸出信號(hào)。
該圖像尤其可以通過(guò)傳感器來(lái)獲得,該傳感器例如相機(jī)、LIDAR傳感器、雷達(dá)傳感器、超聲傳感器、或熱相機(jī)。然而,該圖像也可以是計(jì)算機(jī)生成的,例如通過(guò)用于在計(jì)算機(jī)中呈現(xiàn)虛擬場(chǎng)景的方法,或者是由機(jī)器學(xué)習(xí)模型(例如,生成對(duì)抗網(wǎng)絡(luò))來(lái)生成。
該圖像由該機(jī)器學(xué)習(xí)系統(tǒng)來(lái)處理。換句話說(shuō),該機(jī)器學(xué)習(xí)系統(tǒng)將該圖像取作輸入。該機(jī)器學(xué)習(xí)系統(tǒng)可以優(yōu)選地是被配置用于確定中間信號(hào)的神經(jīng)網(wǎng)絡(luò)。替代地,該機(jī)器學(xué)習(xí)系統(tǒng)可以包括用于確定第一中間輸出的機(jī)器學(xué)習(xí)模型,例如神經(jīng)網(wǎng)絡(luò),即,該機(jī)器學(xué)習(xí)模型可以被配置成執(zhí)行用于確定輸出信號(hào)的方法。
無(wú)論被包括在機(jī)器學(xué)習(xí)模型中還是作為機(jī)器學(xué)習(xí)模型,神經(jīng)網(wǎng)絡(luò)尤其可以是卷積神經(jīng)網(wǎng)絡(luò)、可視變換器或視覺(jué)變換器。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于羅伯特·博世有限公司,未經(jīng)羅伯特·博世有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211148401.2/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 面向語(yǔ)義Web服務(wù)程序設(shè)計(jì)的語(yǔ)義數(shù)據(jù)表示和處理方法
- 一種基于語(yǔ)義的三維模型檢索系統(tǒng)和方法
- 一種計(jì)算機(jī)語(yǔ)義工程系統(tǒng)
- 導(dǎo)航方法及裝置
- 一種分層次多語(yǔ)義網(wǎng)系統(tǒng)及方法
- 一種基于上下文的語(yǔ)義匹配方法和系統(tǒng)
- 遠(yuǎn)程語(yǔ)義識(shí)別方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種基于語(yǔ)義依存關(guān)系的醫(yī)療文本標(biāo)注方法
- 基于多級(jí)語(yǔ)義表征和語(yǔ)義計(jì)算的信號(hào)語(yǔ)義識(shí)別方法
- 語(yǔ)義分類(lèi)方法及裝置、存儲(chǔ)介質(zhì)及電子設(shè)備





