[發(fā)明專利]處理圖像的方法和系統(tǒng)在審
| 申請?zhí)枺?/td> | 201880092703.8 | 申請日: | 2018-09-18 |
| 公開(公告)號: | CN112055847A | 公開(公告)日: | 2020-12-08 |
| 發(fā)明(設(shè)計(jì))人: | D.卡拉姆;L.張;A.吉爾德;Y.渡邊;E.彭納;F.阿哈默德;H.亞當(dāng) | 申請(專利權(quán))人: | 谷歌有限責(zé)任公司 |
| 主分類號: | G06F9/451 | 分類號: | G06F9/451 |
| 代理公司: | 北京市柳沈律師事務(wù)所 11105 | 代理人: | 金玉潔 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 處理 圖像 方法 系統(tǒng) | ||
本公開針對使用一個(gè)或多個(gè)機(jī)器學(xué)習(xí)(ML)模型來處理圖像。具體地,可以接收描述包括多個(gè)不同且獨(dú)特的幀的圖像的數(shù)據(jù);以及,對于多個(gè)不同且獨(dú)特的幀中的每個(gè)幀,至少部分地基于一個(gè)或多個(gè)ML模型和描述圖像的數(shù)據(jù),可以確定該幀的一個(gè)或多個(gè)得分。得分中的每個(gè)得分可以指示確定的該幀相對于各種不同且獨(dú)特的用途中的一個(gè)或多個(gè)的適合性的度量,ML模型被配置為確定圖像對于各種不同且獨(dú)特的用途的適合性。
技術(shù)領(lǐng)域
本公開總體上涉及數(shù)字圖像。更具體地,本公開涉及使用一個(gè)或多個(gè)機(jī)器學(xué)習(xí)(machine learning,ML)模型來處理圖像。
背景技術(shù)
計(jì)算設(shè)備(例如,臺式計(jì)算機(jī)、膝上型計(jì)算機(jī)、平板計(jì)算機(jī)、智能電話、可穿戴計(jì)算設(shè)備等)在現(xiàn)代社會中無處不在。它們可以支持其用戶之間的通信,向其用戶提供有關(guān)其環(huán)境、當(dāng)前事件、整個(gè)世界等的信息。這種設(shè)備的普遍用途是生成、操縱、傳遞和/或類似地處理數(shù)字圖像(例如,圖片、視頻等)。
發(fā)明內(nèi)容
本公開的實(shí)施例的方面和優(yōu)點(diǎn)將在以下描述中部分地闡述,或者可以從描述中習(xí)得,或者可以通過對實(shí)施例的實(shí)踐而習(xí)得。
本公開的一個(gè)示例方面針對一種計(jì)算機(jī)實(shí)現(xiàn)的方法。該方法可以包括:由一個(gè)或多個(gè)計(jì)算設(shè)備提供用于使用一個(gè)或多個(gè)機(jī)器學(xué)習(xí)(ML)模型處理圖像的應(yīng)用編程接口(application programming interface,API),以識別被確定為適合于一個(gè)或多個(gè)不同且獨(dú)特(different and distinct)的用途的圖像。該方法還可以包括:由計(jì)算設(shè)備經(jīng)由API從請求應(yīng)用接收描述圖像的數(shù)據(jù),該圖像包括用于使用ML模型處理的多個(gè)不同且獨(dú)特的幀。該方法還可以包括:對于多個(gè)不同且獨(dú)特的幀中的每個(gè)幀,由計(jì)算設(shè)備至少部分地基于ML模型和描述圖像的數(shù)據(jù)確定該幀的一個(gè)或多個(gè)得分。這些得分中的每個(gè)得分可以指示確定的該幀相對于不同且獨(dú)特的用途中的用途的適合性的度量。該方法還可以包括:對于多個(gè)不同且獨(dú)特的幀中的一個(gè)或多個(gè)幀中的每個(gè)幀,由計(jì)算設(shè)備經(jīng)由API將指示該幀的得分中的至少一個(gè)的數(shù)據(jù)傳遞到請求應(yīng)用。
本公開的另一個(gè)示例方面針對一種系統(tǒng)。該系統(tǒng)可以包括一個(gè)或多個(gè)處理器以及存儲指令的存儲器,該指令在由處理器運(yùn)行時(shí)使系統(tǒng)執(zhí)行操作。該操作可以包括:接收描述包括多個(gè)不同且獨(dú)特的幀的圖像的數(shù)據(jù)。該操作還可以包括:對于多個(gè)不同且獨(dú)特的幀中的每個(gè)幀,至少部分地基于一個(gè)或多個(gè)ML模型和描述圖像的數(shù)據(jù)確定該幀的一個(gè)或多個(gè)得分。這些得分中的每個(gè)得分可以指示確定的該幀相對于各種不同且獨(dú)特的用途中的一個(gè)或多個(gè)的適合性的度量,ML模型被配置為確定圖像對于各種不同且獨(dú)特的用途的適合性。
本公開的又一示例方面針對一個(gè)或多個(gè)非暫時(shí)性計(jì)算機(jī)可讀介質(zhì)。非暫時(shí)性計(jì)算機(jī)可讀介質(zhì)可以包括指令,這些指令在由一個(gè)或多個(gè)計(jì)算設(shè)備運(yùn)行時(shí)使計(jì)算設(shè)備執(zhí)行操作。該操作可以包括:至少部分地基于描述包括多個(gè)不同且獨(dú)特的幀的圖像的數(shù)據(jù),對于多個(gè)不同且獨(dú)特的幀中的每個(gè)幀,利用一個(gè)或多個(gè)ML模型來確定該幀的一個(gè)或多個(gè)得分。得分的每個(gè)得分可以指示確定的該幀相對于各種不同且獨(dú)特的用途中的一個(gè)或多個(gè)的適合性的度量,ML模型被配置為確定圖像對于各種不同且獨(dú)特的用途的適合性。
本公開的其他方面針對各種系統(tǒng)、裝置、非暫時(shí)性計(jì)算機(jī)可讀介質(zhì)、用戶界面和電子設(shè)備。
參考以下描述和所附權(quán)利要求,將更好地理解本公開的各種實(shí)施例的這些和其他特征、方面和優(yōu)點(diǎn)。結(jié)合在本說明書中并構(gòu)成本說明書的一部分的附圖示出了本公開的示例實(shí)施例,并且與描述一起用于解釋相關(guān)原理。
附圖說明
參考附圖在說明書中闡述了針對本領(lǐng)域普通技術(shù)人員的實(shí)施例的詳細(xì)討論,其中:
圖1描繪了根據(jù)本公開的示例實(shí)施例的示例計(jì)算環(huán)境;
圖2A和圖2B描繪了根據(jù)本公開的示例實(shí)施例的示例事件序列;
圖3A至圖3D描繪了根據(jù)本公開的示例實(shí)施例的示例圖形用戶界面(GUI);
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于谷歌有限責(zé)任公司,未經(jīng)谷歌有限責(zé)任公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201880092703.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





