[發(fā)明專(zhuān)利]用于機(jī)器學(xué)習(xí)的圖像變換有效
| 申請(qǐng)?zhí)枺?/td> | 201980010446.3 | 申請(qǐng)日: | 2019-01-30 |
| 公開(kāi)(公告)號(hào): | CN111656390B | 公開(kāi)(公告)日: | 2023-07-07 |
| 發(fā)明(設(shè)計(jì))人: | 卡雷爾·丹尼爾·基勒布魯;拉維·納拉亞納斯瓦米;禹同爀 | 申請(qǐng)(專(zhuān)利權(quán))人: | 谷歌有限責(zé)任公司 |
| 主分類(lèi)號(hào): | G06T1/60 | 分類(lèi)號(hào): | G06T1/60 |
| 代理公司: | 中原信達(dá)知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 11219 | 代理人: | 周亞榮;鄧聰惠 |
| 地址: | 美國(guó)加利*** | 國(guó)省代碼: | 暫無(wú)信息 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 機(jī)器 學(xué)習(xí) 圖像 變換 | ||
方法、系統(tǒng)和裝置,包括用于確定圖像變換的像素坐標(biāo)和用于存儲(chǔ)變換后的圖像數(shù)據(jù)的存儲(chǔ)器地址的裝置。在一些實(shí)現(xiàn)方式中,一種系統(tǒng)包括:處理單元,該處理單元被配置成使用機(jī)器學(xué)習(xí)模型和圖像的像素值來(lái)對(duì)圖像執(zhí)行機(jī)器學(xué)習(xí)計(jì)算;存儲(chǔ)介質(zhì),該存儲(chǔ)介質(zhì)被配置成存儲(chǔ)像素值;以及存儲(chǔ)器地址計(jì)算單元,該存儲(chǔ)器地址計(jì)算單元包括一個(gè)或多個(gè)硬件處理器。處理器被配置成接收?qǐng)D像的圖像數(shù)據(jù)并且確定圖像的尺寸與機(jī)器學(xué)習(xí)模型的尺寸不匹配。作為響應(yīng),處理器確定圖像的變換版本的像素坐標(biāo),并且對(duì)于像素坐標(biāo)中的每一個(gè),確定在存儲(chǔ)介質(zhì)中用于存儲(chǔ)將用于生成機(jī)器學(xué)習(xí)模型的輸入的像素值的存儲(chǔ)器地址。
背景技術(shù)
機(jī)器學(xué)習(xí)能夠用于對(duì)圖像進(jìn)行分類(lèi)。例如,神經(jīng)網(wǎng)絡(luò)能夠用于基于圖像的視覺(jué)特征對(duì)圖像進(jìn)行分類(lèi)。神經(jīng)網(wǎng)絡(luò)是采用一個(gè)或多個(gè)層來(lái)對(duì)于接收到的輸入例如圖像的特征生成輸出例如圖像的分類(lèi)的機(jī)器學(xué)習(xí)模型。一些神經(jīng)網(wǎng)絡(luò)除了包括外層之外還包括一個(gè)或多個(gè)隱藏層。每個(gè)隱藏層的輸出被用作網(wǎng)絡(luò)中的下一個(gè)層即網(wǎng)絡(luò)的下一個(gè)隱藏層或輸出層的輸入。網(wǎng)絡(luò)的每個(gè)層依照相應(yīng)的參數(shù)的集合的當(dāng)前值從接收到的輸入生成輸出。
一些神經(jīng)網(wǎng)絡(luò)包括一個(gè)或多個(gè)卷積神經(jīng)網(wǎng)絡(luò)層。每個(gè)卷積神經(jīng)網(wǎng)絡(luò)層具有關(guān)聯(lián)的內(nèi)核的集合。能夠?qū)?nèi)核表示為權(quán)重輸入的矩陣結(jié)構(gòu)。每個(gè)卷積層都使用內(nèi)核來(lái)處理該層的輸入。也能夠?qū)⒃搶拥妮斎氲募媳硎緸榫仃嚱Y(jié)構(gòu)。
神經(jīng)網(wǎng)絡(luò)被配置成接收特定形狀的圖像。但是,將使用神經(jīng)網(wǎng)絡(luò)來(lái)分類(lèi)的一些圖像可以具有與所配置的形狀不同的形狀。
發(fā)明內(nèi)容
本說(shuō)明書(shū)描述了與專(zhuān)用計(jì)算單元有關(guān)的技術(shù),該專(zhuān)用計(jì)算單元確定圖像變換用像素坐標(biāo)和用于存儲(chǔ)變換后的圖像數(shù)據(jù)的存儲(chǔ)器地址。
通常,能夠在包括處理單元的系統(tǒng)中體現(xiàn)本說(shuō)明書(shū)中描述的主題的一個(gè)創(chuàng)新方面,該處理單元被配置成使用機(jī)器學(xué)習(xí)模型和圖像的像素值來(lái)對(duì)圖像執(zhí)行機(jī)器學(xué)習(xí)計(jì)算。機(jī)器學(xué)習(xí)模型能夠被配置成處理具有特定尺寸的圖像。該系統(tǒng)能夠包括:存儲(chǔ)介質(zhì),該存儲(chǔ)介質(zhì)被配置成存儲(chǔ)圖像的像素值;和存儲(chǔ)器地址計(jì)算單元,該存儲(chǔ)器地址計(jì)算單元包括一個(gè)或多個(gè)硬件處理器。該一個(gè)或多個(gè)硬件處理器能夠被配置成接收?qǐng)D像的圖像數(shù)據(jù)。該圖像數(shù)據(jù)能夠指定圖像的尺寸。圖像的尺寸能夠指定水平像素尺寸和垂直像素尺寸。水平像素尺寸是沿著圖像的水平尺寸的像素的數(shù)目并且垂直像素尺寸是沿著圖像的垂直尺寸的像素的數(shù)目。
一個(gè)或多個(gè)硬件處理器能夠被配置成:確定圖像的尺寸與特定尺寸不匹配;并且響應(yīng)于確定圖像的尺寸與特定尺寸不匹配,基于圖像的尺寸和特定尺寸,確定圖像的水平像素步幅和垂直像素步幅,并且使用水平像素步幅和垂直像素步幅來(lái)確定輸入圖像的變換版本的像素坐標(biāo)。每個(gè)像素坐標(biāo)包括垂直坐標(biāo)和水平坐標(biāo)。像素步幅是用于將原始圖像尺寸轉(zhuǎn)換為特定尺寸的因素。
對(duì)于像素坐標(biāo)中的每一個(gè),一個(gè)或多個(gè)硬件處理器能夠被配置成:確定在存儲(chǔ)介質(zhì)中用于存儲(chǔ)將用于對(duì)于像素坐標(biāo)生成機(jī)器學(xué)習(xí)模型的輸入的一個(gè)或多個(gè)像素值的一個(gè)或多個(gè)存儲(chǔ)器地址,并且將每個(gè)存儲(chǔ)器地址輸出到處理單元。每個(gè)像素坐標(biāo)的一個(gè)或多個(gè)存儲(chǔ)器地址基于像素坐標(biāo)的垂直坐標(biāo)和水平坐標(biāo)。
這些和其它實(shí)現(xiàn)方式能夠各自任選地包括以下特征中的一個(gè)或多個(gè)。在一些方面中,處理單元使用每個(gè)存儲(chǔ)器地址來(lái)訪(fǎng)問(wèn)存儲(chǔ)在存儲(chǔ)器地址處的像素值并且基于存儲(chǔ)在存儲(chǔ)器地址處的像素值來(lái)執(zhí)行機(jī)器學(xué)習(xí)計(jì)算。
在一些方面中,存儲(chǔ)器計(jì)算單元包括用于存儲(chǔ)水平坐標(biāo)的當(dāng)前值的一個(gè)或多個(gè)第一硬件存儲(chǔ)電路和用于存儲(chǔ)垂直坐標(biāo)的當(dāng)前值的一個(gè)或多個(gè)第二硬件存儲(chǔ)電路。一個(gè)或多個(gè)處理器能夠通過(guò)以下步驟確定圖像的像素坐標(biāo):確定包括初始水平坐標(biāo)和初始垂直坐標(biāo)的初始像素坐標(biāo);將初始水平坐標(biāo)存儲(chǔ)在一個(gè)或多個(gè)第一硬件存儲(chǔ)電路中;將初始垂直坐標(biāo)存儲(chǔ)在一個(gè)或多個(gè)第二硬件存儲(chǔ)電路中;對(duì)于用于遍歷圖像的水平像素尺寸的第一循環(huán)的每次迭代,通過(guò)在第一循環(huán)的每次迭代之后將水平像素步幅加到水平坐標(biāo)的當(dāng)前值來(lái)更新水平坐標(biāo)的當(dāng)前值;以及對(duì)于用于遍歷圖像的垂直像素尺寸的第二循環(huán)的每次迭代,通過(guò)在第一第二循環(huán)的每次迭代之后將垂直像素步幅加到垂直坐標(biāo)的當(dāng)前值來(lái)更新垂直坐標(biāo)的當(dāng)前值。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于谷歌有限責(zé)任公司,未經(jīng)谷歌有限責(zé)任公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201980010446.3/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 根據(jù)用戶(hù)學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線(xiàn)上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





