[發(fā)明專利]圖像處理和人群密度估計方法、設備及存儲介質在審
| 申請?zhí)枺?/td> | 202011044576.X | 申請日: | 2020-09-28 |
| 公開(公告)號: | CN113515990A | 公開(公告)日: | 2021-10-19 |
| 發(fā)明(設計)人: | 顏肇義 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00 |
| 代理公司: | 北京太合九思知識產(chǎn)權代理有限公司 11610 | 代理人: | 張愛;劉戈 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 處理 人群 密度 估計 方法 設備 存儲 介質 | ||
1.一種圖像處理方法,其特征在于,包括:
獲取待處理圖像;
對所述待處理圖像進行主體密度估計,以得到所述待處理圖像的第一密度圖;
對所述待處理圖像進行主體識別,以確定所述待處理圖像的主體區(qū)域;
基于所述待處理圖像的主體區(qū)域,對所述第一密度圖進行濾波,以得到所述待處理圖像的第二密度圖。
2.根據(jù)權利要求1所述的方法,其特征在于,所述對所述待處理圖像進行主體識別,以確定所述待處理圖像的主體區(qū)域,包括:
將所述待處理圖像輸入骨干網(wǎng)絡進行特征提取,以得到所述待處理圖像的初始圖像特征;
利用第一分支網(wǎng)絡,對所述初始圖像特征進行主體識別,以得到所述待處理圖像的主體區(qū)域。
3.根據(jù)權利要求2所述的方法,其特征在于,所述利用第一分支網(wǎng)絡,對所述初始圖像特征進行主體識別,以得到所述待處理圖像的主體區(qū)域,包括:
將所述初始圖像特征輸入第一分支網(wǎng)絡;
在所述第一分支網(wǎng)絡中,對所述初始圖像特征進行卷積處理,以得到所述待處理圖像的第一目標特征;其中,所述第一目標特征是所述待處理圖像為主體或背景的特征體現(xiàn);
根據(jù)所述第一目標特征,獲取所述待處理圖像中屬于主體的像素點;
根據(jù)所述待處理圖像中屬于主體的像素點,確定所述待處理圖像的主體區(qū)域。
4.根據(jù)權利要求3所述的方法,其特征在于,所述根據(jù)所述第一目標特征,獲取所述待處理圖像中屬于主體的像素點,包括:
根據(jù)所述第一目標特征,計算所述待處理圖像中的像素點屬于主體和背景的概率;
針對任一像素點,若該像素點屬于主體的概率大于其屬于背景的概率,則確定該像素點屬于主體。
5.根據(jù)權利要求2所述的方法,其特征在于,所述對所述待處理圖像進行主體密度估計,以得到所述待處理圖像的第一密度圖,包括:
利用第二分支網(wǎng)絡,對所述初始圖像特征進行主體密度估計,以得到所述第一密度圖。
6.根據(jù)權利要求5所述的方法,其特征在于,所述利用第二分支網(wǎng)絡,對所述初始圖像特征進行主體密度估計,以得到所述第一密度圖,包括:
將所述初始圖像特征輸入所述第二分支網(wǎng)絡;
在所述第二分支網(wǎng)絡中,對所述初始圖像特征進行卷積處理,以得到所述待處理圖像的第二目標特征;其中,所述第二目標特征是所述待處理圖像的主體密度的特征體現(xiàn);
根據(jù)所述第二目標特征,生成所述第一密度圖。
7.根據(jù)權利要求6所述的方法,其特征在于,所述基于所述待處理圖像的主體區(qū)域,對所述第一密度圖進行濾波,以得到所述待處理圖像的第二密度圖,包括:
在所述第一分支網(wǎng)絡中,基于所述待處理圖像的主體區(qū)域,生成所述待處理圖像的蒙版;所述待處理圖像的蒙版中標注為1的區(qū)域與所述主體區(qū)域相對應;
將所述蒙版與所述第一密度圖相乘,得到所述第二密度圖。
8.根據(jù)權利要求7所述的方法,其特征在于,在基于所述待處理圖像的主體區(qū)域,生成所述待處理圖像的蒙版之前,還包括:
以聯(lián)合損失函數(shù)最小化為訓練目標,利用樣本圖像對初始網(wǎng)絡模型進行聯(lián)合訓練,以得到所述骨干網(wǎng)絡、第一分支網(wǎng)絡和第二分支網(wǎng)絡;其中,所述初始網(wǎng)絡模型包括:初始特征提取網(wǎng)絡、初始分割分支網(wǎng)絡和初始密度估計分支網(wǎng)絡;
其中,所述聯(lián)合損失函數(shù)是根據(jù)模型訓練輸出的蒙版與所述樣本圖像的蒙版真值圖所確定的交叉熵函數(shù),及模型訓練輸出的密度圖和模型訓練輸出的蒙版的乘積與所述樣本圖像的密度真值圖所確定均方差函數(shù)聯(lián)合確定的。
9.根據(jù)權利要求8所述的方法,其特征在于,還包括:
獲取所述樣本圖像的視度圖;
利用激勵函數(shù)對所述樣本圖像的視度圖進行尺度變換,以確定所述樣本圖像的主體區(qū)域;
基于所述樣本圖像的主體區(qū)域,生成所述蒙版真值圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經(jīng)阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011044576.X/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





