[發明專利]利用神經網絡進行目標分割的方法、設備和介質在審
| 申請號: | 202110097767.0 | 申請日: | 2021-01-25 |
| 公開(公告)號: | CN112749707A | 公開(公告)日: | 2021-05-04 |
| 發明(設計)人: | 伍天意;郭國棟;朱歟 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06K9/34 | 分類號: | G06K9/34;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京市漢坤律師事務所 11602 | 代理人: | 姜浩然;吳麗麗 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 利用 神經網絡 進行 目標 分割 方法 設備 介質 | ||
本公開提供了一種利用神經網絡進行目標分割的方法、設備和介質,涉及人工智能技術領域,尤其涉及深度學習和計算機視覺技術領域。該神經網絡包括:第一子網絡,被配置為接收在先圖像以生成在先圖像的在先特征圖;第一子網絡之后的第二子網絡,被配置為接收在先圖像的在先特征圖和在先圖像的目標分割結果以生成在先圖像的至少一組模板特征;與第一子網絡并列的第三子網絡,被配置為接收當前圖像以生成當前圖像的當前特征圖;第二子網絡和第三子網絡之后的第四子網絡,被配置為接收當前特征圖和在先圖像的至少一組模板特征,以生成空時信息特征圖;以及第四子網絡之后的第五子網絡,被配置為接收空時信息特征圖以生成當前圖像的預測目標分割結果。
技術領域
本公開涉及人工智能技術領域,尤其涉及深度學習和計算機視覺技術領域,具體涉及一種利用神經網絡進行目標分割的方法、設備和介質。
背景技術
人工智能是研究使計算機來模擬人的某些思維過程和智能行為(如學習、推理、思考、規劃等)的學科,既有硬件層面的技術也有軟件層面的技術。人工智能硬件技術一般包括如傳感器、專用人工智能芯片、云計算、分布式存儲、大數據處理等技術:人工智能軟件技術主要包括計算機視覺技術、語音識別技術、自然語言處理技術以及機器學習/深度學習、大數據處理技術、知識圖譜技術等幾大方向。
目標分割是計算機視覺的一個熱門方向,廣泛應用于自動駕駛、智能視頻監控、工業檢測等諸多領域。通過實現計算機視覺減少對人力資本的消耗,具有重要的現實意義。因此,目標分割也就成為了近年來理論和應用的研究熱點。由于深度學習的廣泛運用,目標分割方法得到了快速的發展,但現有的目標分割方法的準確率仍有待提高。
在此部分中描述的方法不一定是之前已經設想到或采用的方法。除非另有指明,否則不應假定此部分中描述的任何方法僅因其包括在此部分中就被認為是現有技術。類似地,除非另有指明,否則此部分中提及的問題不應認為在任何現有技術中已被公認。
發明內容
本公開提供了一種利用神經網絡進行目標分割的方法、設備和介質。
根據本公開的一方面,提供了一種神經網絡,所述神經網絡被配置用于接收當前圖像、在先圖像和所述在先圖像的目標分割結果以預測所述當前圖像的目標分割結果,所述目標分割結果用于指示對應的圖像中的每一個像素的類別,所述神經網絡包括:第一子網絡,所述第一子網絡被配置為接收所述在先圖像以生成所述在先圖像的在先特征圖;所述第一子網絡之后的第二子網絡,所述第二子網絡被配置為接收所述在先圖像的在先特征圖和所述在先圖像的目標分割結果以生成所述在先圖像的至少一組模板特征;與所述第一子網絡并列的第三子網絡,所述第三子網絡被配置為接收所述當前圖像以生成所述當前圖像的當前特征圖;所述第二子網絡和所述第三子網絡之后的第四子網絡,所述第四子網絡被配置為接收所述當前特征圖和所述在先圖像的至少一組模板特征,以生成空時信息特征圖;以及所述第四子網絡之后的第五子網絡,所述第五子網絡被配置為接收所述空時信息特征圖以生成所述當前圖像的預測目標分割結果。
根據本公開的另一方面,提供了一種利用神經網絡進行目標分割的方法,所述神經網絡包括順序連接的第一子網絡、第二子網絡、第四子網絡、第五子網絡和第四子網絡之前的第三子網絡,所述方法包括:利用所述第一子網絡處理在先圖像,其中,所述第一子網絡被配置為接收所述在先圖像以生成所述在先圖像的在先特征圖;利用所述第二子網絡處理所述在先特征圖和所述在先圖像的目標分割結果,其中,所述第二子網絡被配置為接收所述在先特征圖和所述在先圖像的目標分割結果以生成所述在先圖像的至少一組模板特征;利用所述第三子網絡處理當前圖像,其中,所述第三子網絡被配置為接收所述當前圖像以生成所述當前圖像的當前特征圖;利用所述第四子網絡處理所述當前特征圖和所述在先圖像的至少一組模板特征,其中,所述第四子網絡被配置為接收所述當前特征圖和所述在先圖像的至少一組模板特征,以生成空時信息特征圖;以及利用所述第五子網絡處理所述空時信息特征圖,其中,所述第五子網絡被配置為接收所述空時信息特征圖以生成所述當前圖像的預測目標分割結果,其中,所述目標分割結果用于指示對應的圖像中的每一個像素的類別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110097767.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種高效率全自動魚鱗去除機
- 下一篇:一種易拆裝發動機與發電機連接結構





