[發(fā)明專利]一種信息處理方法及裝置有效
| 申請?zhí)枺?/td> | 202180001104.2 | 申請日: | 2021-04-26 |
| 公開(公告)號: | CN113348463B | 公開(公告)日: | 2022-05-10 |
| 發(fā)明(設(shè)計)人: | 劉楊 | 申請(專利權(quán))人: | 華為技術(shù)有限公司 |
| 主分類號: | G06V40/20 | 分類號: | G06V40/20;G06V10/40;G06V10/82;G06N3/04 |
| 代理公司: | 深圳市深佳知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44285 | 代理人: | 聶秀娜 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 信息處理 方法 裝置 | ||
本申請公開了一種信息處理方法,可以應(yīng)用于例如車輛、手持終端等計算機中,車輛例如為智能汽車、智能網(wǎng)聯(lián)汽車上,該方法用于實現(xiàn)視覺認知過程,該方法包括:獲取圖像,將圖像輸入特征提取模型,從特征提取模型中獲取第一特征圖。之后,將第一特征圖輸入第一語義識別模型,從第一語義識別模型獲取第一目標(biāo)語義信息。通過將用于視覺認知過程拆分為兩個機器學(xué)習(xí)模型實現(xiàn),便于對視覺認知過程進行優(yōu)化,提高視覺認知的準(zhǔn)確性,進而提高視覺任務(wù)的準(zhǔn)確性。
技術(shù)領(lǐng)域
本申請涉及人工智能領(lǐng)域,尤其涉及一種信息處理方法及裝置。
背景技術(shù)
計算機視覺是人工智能領(lǐng)域的一個重要分支,是指計算機能夠代替人眼和大腦對環(huán)境和其中的刺激(或稱對象)進行視覺認知,例如計算機識別人的手部姿態(tài)所表達的語義信息?;谝曈X認知的結(jié)果,計算機能夠執(zhí)行視覺任務(wù),例如,通過獲取和處理駕駛員的圖像,計算機能夠識別駕駛員是否正在飲水,基于該識別結(jié)果,計算機能夠在駕駛員飲水時,播放語音信息“注意行車安全哦”。
計算機執(zhí)行視覺任務(wù)的準(zhǔn)確性取決于視覺認知的準(zhǔn)確性。然而,由于用于實現(xiàn)計算機視覺的視覺系統(tǒng)的復(fù)雜度一般較高,對視覺系統(tǒng)進行調(diào)整或優(yōu)化的成本較高,不利于對視覺系統(tǒng)進行持續(xù)優(yōu)化,進而影響了視覺任務(wù)的準(zhǔn)確執(zhí)行。
發(fā)明內(nèi)容
本申請實施例提供了一種信息處理方法及裝置,用于對獲取的圖像執(zhí)行可感知的視覺認知過程,便于對該視覺認知過程進行調(diào)整或優(yōu)化,從而有利于對視覺系統(tǒng)進行持續(xù)優(yōu)化,進而提高計算機執(zhí)行視覺任務(wù)的準(zhǔn)確性。
下面對本申請實施例方法和裝置進行分別介紹。
第一方面,本申請實施例提供一種信息處理方法,該方法可以應(yīng)用于第一設(shè)備,第一設(shè)備能夠根據(jù)目標(biāo)對象的圖像來識別目標(biāo)對象的形貌所表達的語義信息。
具體的,第一設(shè)備設(shè)置有特征提取模型和語義識別模型,這兩個模型均是通過機器學(xué)習(xí)方法訓(xùn)練得到的。其中,特征提取模型的輸入為圖像,特征提取模型用于根據(jù)輸入的圖像提取目標(biāo)對象的特征圖,提取的特征圖用于描述目標(biāo)對象對應(yīng)于相應(yīng)圖像的形貌。在一種可能的實現(xiàn)方式中,例如通過對該特征圖進行可視化處理(如渲染)等操作能夠得到包括目標(biāo)對象的圖像或視頻幀,該圖像或視頻幀中目標(biāo)對象的形貌為該特征圖所描述的形貌。語義識別模型的輸入為目標(biāo)對象的特征圖,語義識別模型用于根據(jù)輸入的特征圖確定語義信息,語義信息為特征圖描述的形貌所表達的含義,例如,正在打哈欠??蛇x的,語義識別模型用于為視覺任務(wù)提供語義信息,考慮到第一設(shè)備可以為多個視覺任務(wù)提供語義信息,將第一方面涉及的語義識別模型稱作第一語義識別模型,將其輸出的語義信息稱作第一語義信息,將第一語義信息所服務(wù)的視覺任務(wù)稱作第一視覺任務(wù)。
基于上述兩個模型,第一設(shè)備可以執(zhí)行如下視覺認知過程。
首先,第一設(shè)備可以獲取圖像。該圖像所描述的對象包括目標(biāo)對象,可選的,還可以包括目標(biāo)對象以外的其他對象(稱作背景)。假設(shè)目標(biāo)對象為人,圖像中人以外的其他對象(例如沙發(fā),電視,墻壁等)為背景。該圖像能夠捕獲目標(biāo)對象的特定形貌。
第一設(shè)備獲取到圖像后,將該圖像輸入特征提取模型,從特征提取模型中獲取對應(yīng)于該圖像的第一特征圖。該第一特征圖為特征提取模型根據(jù)輸入的該圖像提取的目標(biāo)對象的特征圖。第一特征圖用于描述目標(biāo)對象的第一形貌。在一種可能的實現(xiàn)方式中,通過對該第一特征圖進行可視化處理(如渲染)等操作能夠得到包括目標(biāo)對象的圖像或視頻幀,該圖像或視頻幀中目標(biāo)對象的形貌為該特征圖所描述的第一形貌。例如,假設(shè)人在拍照時正在打哈欠,那么,將拍照得到的圖像輸入特征提取模型后,提取的第一特征圖用于描述人正在打哈欠的姿勢。
第一設(shè)備獲取到第一特征圖后,將第一特征圖輸入第一語義識別模型,從第一語義識別模型中獲取第一目標(biāo)語義信息。第一目標(biāo)語義信息為從輸入第一語義識別模型的第一特征圖中識別到的語義信息。第一目標(biāo)語義信息用于描述第一形貌所表達的含義。例如,假設(shè)第一特征圖用于描述人正在打哈欠的姿勢,那么第一目標(biāo)語義信息可以表示:目標(biāo)對象正在打哈欠。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華為技術(shù)有限公司,未經(jīng)華為技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202180001104.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





