[發(fā)明專利]基于感興趣區(qū)域的對象檢測方法及裝置有效
| 申請?zhí)枺?/td> | 201310219546.1 | 申請日: | 2013-06-04 |
| 公開(公告)號: | CN103345738A | 公開(公告)日: | 2013-10-09 |
| 發(fā)明(設計)人: | 丁二銳;陳世佳 | 申請(專利權)人: | 北京百度網(wǎng)訊科技有限公司 |
| 主分類號: | G06T7/00 | 分類號: | G06T7/00;G06T3/00 |
| 代理公司: | 北京鴻德海業(yè)知識產(chǎn)權代理事務所(普通合伙) 11412 | 代理人: | 袁媛 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 感興趣 區(qū)域 對象 檢測 方法 裝置 | ||
【技術領域】
本發(fā)明涉及對象檢測技術,尤其涉及一種基于感興趣區(qū)域(Region?Of?Interest,ROI)的對象檢測方法及裝置。
【背景技術】
隨著通信技術的發(fā)展,終端集成了越來越多的功能,從而使得終端的系統(tǒng)功能列表中包含了越來越多相應的應用程序。有些應用程序中會涉及一些圖像中的對象識別服務,例如,根據(jù)從圖像中檢測出的人臉特征,匹配到預先存儲的某個特征,等。在對象識別服務中,客戶端需要對源圖像進行多尺度掃描,以遍歷源圖像在每個尺度上的不同圖像,通過判斷掃描窗口內是否為待識別的對象,來檢測出該對象。
然而,采用對源圖像進行多尺度掃描的方式,進行對象檢測,掃描時間長,而且檢測結果并不一定就是用戶關心的目標對象,從而導致了對象檢測的效率和可靠性的降低。
【發(fā)明內容】
本發(fā)明的多個方面提供一種基于感興趣區(qū)域的對象檢測方法及裝置,用以提高對象檢測的效率和可靠性。
本發(fā)明的一方面,提供一種基于感興趣區(qū)域的對象檢測方法,包括:
根據(jù)用戶對目標圖像的變換操作,確定目標圖像的感興趣區(qū)域;
根據(jù)目標圖像與源圖像的映射關系,以及所述目標圖像的感興趣區(qū)域,獲得源圖像的感興趣區(qū)域;
對所述源圖像的感興趣區(qū)域進行多尺度掃描,以獲得對象檢測結果。
如上所述的方面和任一可能的實現(xiàn)方式,進一步提供一種實現(xiàn)方式,所述對所述源圖像的感興趣區(qū)域進行多尺度掃描,以獲得對象檢測結果,包括:
根據(jù)最佳視覺窗口尺寸和掃描窗口尺寸,獲得第一縮放系數(shù)和至少一個第二縮放系數(shù);
利用所述第一縮放系數(shù)和所述至少一個第二縮放系數(shù),對所述源圖像的感興趣區(qū)域進行掃描,以獲得所述對象檢測結果。
如上所述的方面和任一可能的實現(xiàn)方式,進一步提供一種實現(xiàn)方式,所述根據(jù)最佳視覺窗口尺寸和掃描窗口尺寸,獲得第一縮放系數(shù)和至少一個第二縮放系數(shù),包括:
根據(jù)最佳視覺窗口尺寸與掃描窗口尺寸的比值,獲得所述第一縮放系數(shù);
根據(jù)所述第一縮放系數(shù)和尺度變化參數(shù),獲得所述至少一個第二縮放系數(shù)。
如上所述的方面和任一可能的實現(xiàn)方式,進一步提供一種實現(xiàn)方式,所述尺度變化參數(shù)包括下列中的至少一項:
變化范圍;
變化單位;
變化個數(shù);以及
變化方向。
如上所述的方面和任一可能的實現(xiàn)方式,進一步提供一種實現(xiàn)方式,所述根據(jù)目標圖像與源圖像的映射關系,以及所述目標圖像的感興趣區(qū)域,獲得源圖像的感興趣區(qū)域,包括:
根據(jù)所述變換操作的操作系數(shù),對所述源圖像進行所述變換操作,以獲得變換之后的源圖像;
根據(jù)目標圖像與源圖像的映射關系,以及所述目標圖像的感興趣區(qū)域,在所述變換之后的源圖像上,獲得所述源圖像的感興趣區(qū)域。
如上所述的方面和任一可能的實現(xiàn)方式,進一步提供一種實現(xiàn)方式,所述根據(jù)目標圖像與源圖像的映射關系,以及所述目標圖像的感興趣區(qū)域,獲得源圖像的感興趣區(qū)域,包括:
根據(jù)目標圖像與源圖像的映射關系,以及所述目標圖像的感興趣區(qū)域,在所述源圖像上,獲得對應區(qū)域;
根據(jù)所述變換操作的操作系數(shù),對所述對應區(qū)域進行所述變換操作,以獲得所述源圖像的感興趣區(qū)域。
如上所述的方面和任一可能的實現(xiàn)方式,進一步提供一種實現(xiàn)方式,所述變換操作包括下列中的至少一項:
單擊操作;
雙擊操作;
放大操作;
縮小操作;以及
平移操作。
本發(fā)明的另一方面,提供一種基于感興趣區(qū)域的對象檢測裝置,包括:
確定單元,用于根據(jù)用戶對目標圖像的變換操作,確定目標圖像的感興趣區(qū)域;
獲得單元,用于根據(jù)目標圖像與源圖像的映射關系,以及所述目標圖像的感興趣區(qū)域,獲得源圖像的感興趣區(qū)域;
掃描單元,用于對所述源圖像的感興趣區(qū)域進行多尺度掃描,以獲得對象檢測結果。
如上所述的方面和任一可能的實現(xiàn)方式,進一步提供一種實現(xiàn)方式,所述掃描單元,具體用于
根據(jù)最佳視覺窗口尺寸和掃描窗口尺寸,獲得第一縮放系數(shù)和至少一個第二縮放系數(shù);以及利用所述第一縮放系數(shù)和所述至少一個第二縮放系數(shù),對所述源圖像的感興趣區(qū)域進行掃描,以獲得所述對象檢測結果。
如上所述的方面和任一可能的實現(xiàn)方式,進一步提供一種實現(xiàn)方式,所述掃描單元,具體用于
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網(wǎng)訊科技有限公司,未經(jīng)北京百度網(wǎng)訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310219546.1/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。





