[發明專利]用于生成信息的方法和裝置有效
| 申請號: | 201810286286.2 | 申請日: | 2018-03-30 |
| 公開(公告)號: | CN108648226B | 公開(公告)日: | 2019-10-22 |
| 發明(設計)人: | 亢樂;包英澤 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G06T7/593 | 分類號: | G06T7/593;G06N3/04 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐;馬曉亞 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 子網絡 目標圖像 特征提取 級聯 視差圖生成 神經網絡 尾級 方法和裝置 生成信息 特征圖像 信息生成 輸出 視差圖 視差 申請 | ||
本申請實施例公開了用于生成信息的方法和裝置。該方法的一具體實施方式包括:通過獲取包括第一目標圖像和第二目標圖像的目標圖像組;獲取預先訓練的神經網絡,其中,神經網絡包括至少兩個級聯的子網絡,至少兩個級聯的子網絡中的各級子網絡分別包括特征提取層和視差圖生成層;對于神經網絡,執行以下視差圖生成步驟:將目標圖像組輸入至少兩個級聯的子網絡中首級子網絡的特征提取層,獲得由至少兩個級聯的子網絡中的尾級子網絡的特征提取層輸出的特征圖像組;將尾級子網絡的特征提取層輸出的特征圖像組輸入尾級子網絡的視差圖生成層,獲得用于表征第一目標圖像和第二目標圖像的視差的視差圖。該實施方式實現了富于準確性的信息生成。
技術領域
本申請實施例涉及計算機技術領域,尤其涉及用于生成信息的方法和裝置。
背景技術
雙目視覺是模擬人類視覺原理,使用計算機被動感知距離的方法。從兩個或者多個點觀察一個物體,獲取在不同視角下的圖像,根據圖像之間像素的匹配關系,通過三角測量原理計算出像素之間的偏移,進而獲取物體的三維信息。
通常,得到了物體的景深信息,就可以計算出物體與相機之間的實際距離、物體的三維大小以及兩點或多點之間的實際距離。
發明內容
本申請實施例提出了用于生成信息的方法和裝置。
第一方面,本申請實施例提供了一種用于生成信息的方法,該方法包括:獲取包括第一目標圖像和第二目標圖像的目標圖像組,其中,第一目標圖像和第二目標圖像為雙目視覺圖像;獲取預先訓練的神經網絡,其中,神經網絡包括至少兩個級聯的子網絡,至少兩個級聯的子網絡中的各級子網絡分別包括特征提取層和視差圖生成層,各級子網絡的特征提取層從首至尾依次連接,且各級子網絡的視差圖生成層從尾至首依次連接;對于神經網絡,執行以下視差圖生成步驟:將目標圖像組輸入至少兩個級聯的子網絡中首級子網絡的特征提取層,獲得由至少兩個級聯的子網絡中的尾級子網絡的特征提取層輸出的特征圖像組;將尾級子網絡的特征提取層輸出的特征圖像組輸入尾級子網絡的視差圖生成層,獲得由首級子網絡的視差圖生成層輸出的、用于表征第一目標圖像和第二目標圖像的視差的視差圖。
在一些實施例中,對于至少兩個級聯的子網絡中除尾級子網絡外的每級子網絡,該級子網絡所包括的視差圖生成層包括依次連接的形變層、相關層和反卷積層;其中,該級子網絡的形變層用于將該級子網絡的特征提取層輸出的特征圖像組中的第一特征圖像和該級子網絡的下一級子網絡的視差圖生成層返回的視差圖作為輸入,輸出該級子網絡的特征提取層輸出的特征圖像組中的第二特征圖像的預測圖像;該級子網絡的相關層用于將該級子網絡的形變層輸出的預測圖像和該級子網絡的特征提取層輸出的特征圖像組中的第二特征圖像作為輸入,輸出該級子網絡的形變層輸出的預測圖像與該級子網絡的特征提取層輸出的特征圖像組中的第二特征圖像的相關圖;該級子網絡的反卷積層用于將該級子網絡的相關層輸出的相關圖和該級子網絡的下一級子網絡的視差圖生成層輸出的視差圖作為輸入,獲得由該級子網絡的視差圖生成層輸出的視差圖,該級子網絡的下一級子網絡為與該級子網絡相鄰的兩個子網絡中,沿尾級子網絡至首級子網絡方向用于向該級子網絡輸入視差圖的子網絡。
在一些實施例中,尾級子網絡的視差圖生成層包括第一視差圖生成層和第二視差圖生成層;以及將尾級子網絡的特征提取層輸出的特征圖像組輸入尾級子網絡的視差圖生成層,獲得由首級子網絡的視差圖生成層輸出的、用于表征第一目標圖像和第二目標圖像的視差的視差圖,包括:將尾級子網絡的特征提取層輸出的特征圖像組輸入尾級子網絡的視差圖生成層中的第一視差圖生成層,獲得由尾級子網絡的第一視差圖生成層輸出的初始視差圖;將尾級子網絡的特征提取層輸出的特征圖像組和所獲得的初始視差圖輸入尾級子網絡的視差圖生成層中的第二視差圖生成層,獲得由首級子網絡的視差圖生成層輸出的、用于表征第一目標圖像和第二目標圖像的視差的視差圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810286286.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:目標圖像獲取系統與方法
- 下一篇:打印費用計算方法、裝置及打印系統





