[發(fā)明專(zhuān)利]圖像處理方法和終端、裝置、電子設(shè)備、存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202211058860.1 | 申請(qǐng)日: | 2022-08-30 |
| 公開(kāi)(公告)號(hào): | CN115393851A | 公開(kāi)(公告)日: | 2022-11-25 |
| 發(fā)明(設(shè)計(jì))人: | 張睿博;林輝;李志;韓旭;任子輝;李繼偉;肖云龍 | 申請(qǐng)(專(zhuān)利權(quán))人: | 網(wǎng)易有道(杭州)智能科技有限公司 |
| 主分類(lèi)號(hào): | G06V30/14 | 分類(lèi)號(hào): | G06V30/14;G06V30/166;G06V30/148;G06V30/41;G06V30/414 |
| 代理公司: | 北京派特恩知識(shí)產(chǎn)權(quán)代理有限公司 11270 | 代理人: | 董亞莉;蔣雅潔 |
| 地址: | 310007 浙江省杭州市中國(guó)(浙江)自由*** | 國(guó)省代碼: | 浙江;33 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 圖像 處理 方法 終端 裝置 電子設(shè)備 存儲(chǔ) 介質(zhì) | ||
本發(fā)明的實(shí)施方式提供了一種圖像處理方法和終端、裝置、電子設(shè)備、存儲(chǔ)介質(zhì),其中,該方法包括:對(duì)圖像幀序列中的第一圖像進(jìn)行縮小處理,得到第二圖像;對(duì)第二圖像中的指示對(duì)象進(jìn)行位置識(shí)別,得到指示對(duì)象在第二圖像中的指示位置;基于指示位置對(duì)當(dāng)前的選取位置進(jìn)行更新,得到更新后的選取位置,當(dāng)前的選取位置是基于第一圖像的前一幀圖像對(duì)應(yīng)的指示位置確定的;從第一圖像中選取與目標(biāo)位置對(duì)應(yīng)的第三圖像,目標(biāo)位置包括以下之一:當(dāng)前的選取位置、更新后的選取位置;對(duì)第三圖像中的目標(biāo)對(duì)象進(jìn)行識(shí)別,得到識(shí)別結(jié)果。本發(fā)明的方法可以減少對(duì)指示對(duì)象所指示的目標(biāo)對(duì)象進(jìn)行識(shí)別所需的整體運(yùn)算資源開(kāi)銷(xiāo)和整體耗時(shí),提高整體識(shí)別的效率。
技術(shù)領(lǐng)域
本發(fā)明的實(shí)施方式涉及計(jì)算機(jī)視覺(jué)技術(shù)領(lǐng)域,更具體地,本發(fā)明的實(shí)施方式涉及一種圖像處理方法和終端、裝置、電子設(shè)備、存儲(chǔ)介質(zhì)。
背景技術(shù)
本部分旨在為權(quán)利要求書(shū)中陳述的本發(fā)明的實(shí)施方式提供背景或上下文。此處的描述不因?yàn)榘ㄔ诒静糠种芯统姓J(rèn)是現(xiàn)有技術(shù)。
隨著計(jì)算機(jī)視覺(jué)技術(shù)的發(fā)展,利用圖像處理技術(shù),對(duì)目標(biāo)對(duì)象進(jìn)行識(shí)別的應(yīng)用場(chǎng)景越來(lái)越多。在一些應(yīng)用場(chǎng)景中,可以通過(guò)圖像處理技術(shù)對(duì)指示對(duì)象(如手指、詞典筆等)所指示的目標(biāo)對(duì)象進(jìn)行識(shí)別。例如,在指尖查詞的場(chǎng)景中,用戶可以用手指在讀物上指出待識(shí)別的字詞,利用圖像處理技術(shù),可以對(duì)用戶手指所指示的字詞進(jìn)行識(shí)別,從而輔助用戶進(jìn)行閱讀或生詞學(xué)習(xí)等。
但是,在相關(guān)技術(shù)中對(duì)指示對(duì)象所指示的目標(biāo)對(duì)象進(jìn)行識(shí)別的方案中,識(shí)別目標(biāo)對(duì)象的整體運(yùn)算資源開(kāi)銷(xiāo)較大,且耗時(shí)較長(zhǎng)、識(shí)別效率較低。
發(fā)明內(nèi)容
為此,非常需要一種改進(jìn)的圖像處理方法及相關(guān)產(chǎn)品,以減小對(duì)指示對(duì)象所指示的目標(biāo)對(duì)象進(jìn)行識(shí)別所需的運(yùn)算資源開(kāi)銷(xiāo)和耗時(shí)。
在本上下文中,本發(fā)明的實(shí)施方式期望提供一種圖像處理方法和終端、裝置、電子設(shè)備、存儲(chǔ)介質(zhì)。
在本發(fā)明實(shí)施方式的第一方面中,提供了一種圖像處理方法,應(yīng)用于終端,包括:
對(duì)圖像幀序列中的第一圖像進(jìn)行縮小處理,得到第二圖像;
對(duì)所述第二圖像中的指示對(duì)象進(jìn)行位置識(shí)別,得到所述指示對(duì)象在所述第二圖像中的指示位置;
基于所述指示位置對(duì)當(dāng)前的選取位置進(jìn)行更新,得到更新后的選取位置;其中,所述當(dāng)前的選取位置是基于所述第一圖像的前一幀圖像對(duì)應(yīng)的指示位置確定的;
從所述第一圖像中選取與目標(biāo)位置對(duì)應(yīng)的第三圖像,所述目標(biāo)位置包括以下之一:所述當(dāng)前的選取位置、所述更新后的選取位置;
對(duì)所述第三圖像中的目標(biāo)對(duì)象進(jìn)行識(shí)別,得到識(shí)別結(jié)果。
在本發(fā)明的一些實(shí)施例中,該方法還包括:基于所述指示位置、以及所述圖像幀序列中在所述第一圖像之前的至少一幀圖像對(duì)應(yīng)的歷史指示位置,確定所述指示對(duì)象的移動(dòng)狀態(tài);在所述移動(dòng)狀態(tài)表征所述指示對(duì)象已停止移動(dòng)的情況下,顯示所述第二圖像,和/或按照設(shè)定的輸出方式,對(duì)所述識(shí)別結(jié)果進(jìn)行輸出;所述輸出方式包括以下至少之一:顯示輸出、語(yǔ)音輸出。這樣,可以在確定指示對(duì)象已停止移動(dòng)的情況下快速輸出識(shí)別結(jié)果,減少用戶的等待時(shí)間。
在本發(fā)明的另一些實(shí)施例中,所述基于所述指示位置對(duì)當(dāng)前的選取位置進(jìn)行更新,得到更新后的選取位置,包括:在所述指示位置與當(dāng)前的選取位置不同的情況下,將所述指示位置確定為更新后的選取位置。這樣,可以在指示位置發(fā)生變化的情況下及時(shí)對(duì)選取位置進(jìn)行更新,從而進(jìn)一步提高目標(biāo)對(duì)象識(shí)別的準(zhǔn)確性。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于網(wǎng)易有道(杭州)智能科技有限公司,未經(jīng)網(wǎng)易有道(杭州)智能科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211058860.1/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 用戶從用戶終端遠(yuǎn)程訪問(wèn)終端設(shè)備的遠(yuǎn)程訪問(wèn)系統(tǒng)和方法
- 功能信息通知系統(tǒng)及功能信息通知方法
- 一種用于殯儀館的計(jì)算機(jī)信息處理裝置
- 視頻通話切換方法和系統(tǒng)
- 一種終端能力上報(bào)方法、基站及終端
- 野外消防遠(yuǎn)程監(jiān)控系統(tǒng)及其監(jiān)控方法
- 終端主體、終端屏幕和終端
- 一種終端類(lèi)型的確定方法、網(wǎng)絡(luò)設(shè)備及終端
- 一種數(shù)據(jù)傳輸方法及裝置
- 一種基于網(wǎng)絡(luò)運(yùn)營(yíng)的一站式零售直播矩陣平臺(tái)





