[發明專利]用于圖像處理的方法、裝置、設備、介質和程序產品在審
| 申請號: | 202011414770.2 | 申請日: | 2020-12-04 |
| 公開(公告)號: | CN112541418A | 公開(公告)日: | 2021-03-23 |
| 發明(設計)人: | 余永佳;李國洪;張柳清 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06N3/04;G06N3/08 |
| 代理公司: | 北京市金杜律師事務所 11256 | 代理人: | 趙林琳;彭夢曄 |
| 地址: | 100094 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 圖像 處理 方法 裝置 設備 介質 程序 產品 | ||
根據本公開的示例實施例,提供了一種用于圖像處理的方法、裝置、設備、計算機可讀存儲介質和計算機程序產品??捎糜趫D像處理領域和手部跟蹤領域。一種用于圖像處理的方法,包括:獲取圖像幀;確定圖像幀中目標手部的存在性和與目標手部的手指相關聯的多個目標關鍵點;如果圖像幀中存在目標手部,利用多個目標關鍵點,確定圖像幀中包含多個目標關鍵點的跟蹤范圍;以及基于跟蹤范圍,跟蹤目標手部。由此,本方案可以實現動態、穩定、精確和低功耗的手部跟蹤。
技術領域
本公開的實施例主要涉及圖像處理領域,并且更具體地,涉及用于圖像處理的方法、裝置、設備、計算機可讀存儲介質和計算機程序產品。
背景技術
隨著信息技術的快速發展,出現了越來越多依賴人機交互(Human-ComputerInteraction,HCI)技術的場景。人機交互主要研究用戶與系統之間的信息交流。系統可以指代各種設備,諸如智能電話、智能電視、智能手表、智能音箱等。用戶可以通過語音、臉部表情、手勢、身體姿勢等向系統傳遞信息。同時,系統需要通過各種輸出設備,諸如音箱、顯示器、機械裝置等,向用戶輸出反饋。
在理想狀態下,人機交互不再依賴于觸摸屏、遙控器、鼠標、鍵盤等中間設備,而是趨向于接近人與人之間的自然交流模式,從而實現人類與虛擬世界的融合。在科技與需求的雙向驅動下,人機交互經歷了三次重大革命:(1)鼠標,(2)多點觸控,以及(3)體感交互,其中體感交互是人機交互未來的重要發展方向,也是對用戶而言最自然的交互方式。體感交互可以依賴于激光傳感器。然而,激光傳感器成本較高,因此難以普及。由于當前的智能電話和各種可穿戴設備上通常配置有攝像頭,以及人工智能視覺技術的進步,攝像頭成為更適當的選擇。
在體感交互中,手勢交互是一個重要發展方向。手勢交互可以應用于各種場景。例如,在司機駕駛過程中,有些路段十分嘈雜,系統可能難以識別司機的語音指令,而司機低頭使用觸摸屏又存在極大的交通安全風險。此時,采用手勢交互,可以使系統相對安全的完成用戶的指令。另外,在利用智能眼鏡的增強現實(AR)場景中,語音指令有時存在明顯的歧義,系統需要多輪交互才能準確理解用戶的操作意圖。此時,采用手勢交互,能夠幫助系統更簡單和快捷的理解用戶。
然而,傳統的手部跟蹤技術并不穩定和精確,常常出現跟丟或誤跟,同時功耗較高,對計算設備(尤其是移動設備)造成了極大的負擔。
發明內容
根據本公開的示例實施例,提供了一種用于圖像處理的方案。
在本公開的第一方面中,提供了一種用于圖像處理的方法,包括:獲取圖像幀;確定圖像幀中目標手部的存在性和與目標手部的手指相關聯的多個目標關鍵點;如果圖像幀中存在目標手部,利用多個目標關鍵點,確定圖像幀中包含多個目標關鍵點的跟蹤范圍;以及基于跟蹤范圍,跟蹤目標手部。
在本公開的第二方面中,提供了一種圖像處理裝置,包括:獲取模塊,被配置為獲取圖像幀;第一確定模塊,被配置為確定圖像幀中目標手部的存在性和與目標手部的手指相關聯的多個目標關鍵點;第二確定模塊,被配置為如果圖像幀中存在目標手部,利用多個目標關鍵點,確定圖像幀中包含多個目標關鍵點的跟蹤范圍;以及跟蹤模塊,被配置為基于跟蹤范圍,跟蹤目標手部。
在本公開的第三方面中,提供了一種電子設備,包括一個或多個處理器;以及存儲裝置,用于存儲一個或多個程序,當一個或多個程序被一個或多個處理器執行,使得一個或多個處理器實現根據本公開的第一方面的方法。
在本公開的第四方面中,提供了一種計算機可讀介質,其上存儲有計算機程序,該程序被處理器執行時實現根據本公開的第一方面的方法。
在本公開的第五方面中,提供了一種計算機程序產品,包括計算機程序指令,其特征在于,該計算機程序指令被處理器執行時實現根據本公開的第一方面的方法。
應當理解,發明內容部分中所描述的內容并非旨在限定本公開的實施例的關鍵或重要特征,亦非用于限制本公開的范圍。本公開的其它特征將通過以下的描述變得容易理解。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011414770.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種便于安裝部署的疫情防控監控設備
- 下一篇:一種不可調試可視尿道擴張器
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





