[發明專利]用于矯正圖像的方法和裝置有效
| 申請號: | 201811139640.5 | 申請日: | 2018-09-28 |
| 公開(公告)號: | CN109345460B | 公開(公告)日: | 2020-04-24 |
| 發明(設計)人: | 譚嘯;丁二銳;孫昊 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G06T3/60 | 分類號: | G06T3/60 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐;馬曉亞 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 矯正 圖像 方法 裝置 | ||
本申請實施例公開了用于矯正圖像的方法和裝置。該方法的一具體實施方式包括:在預設角度范圍內確定至少一個采樣角度;對于至少一個采樣角度中的每個采樣角度,將目標圖像旋轉該采樣角度,得到與該采樣角度對應的旋轉后圖像;對于所得到的至少一個旋轉后圖像中的每個旋轉后圖像,將該旋轉后圖像輸入預先訓練的非旋轉圖像檢測模型,得到與該旋轉后圖像對應的非旋轉圖像分值,其中,非旋轉圖像檢測模型用于表征圖像與非旋轉圖像分值之間的對應關系;將至少一個旋轉后圖像中對應的非旋轉圖像分值最高的旋轉后圖像確定為與目標圖像對應的矯正后圖像。該實施方式不需拍攝圖像的相機設置陀螺儀,可以在更細粒度上確定圖像的旋轉角度。
技術領域
本申請實施例涉及計算機技術領域,具體涉用于矯正圖像的方法和裝置。
背景技術
目前,有大量場合需要對圖像進行旋轉角度的矯正,使得矯正后圖像中的人、物處于正常、正向、正立角度。例如,在圖像識別過程中,通常會提前采用訓練樣本圖像建立圖像識別模型,而訓練樣本圖像中的人、物等通常都是正常、正向、正立角度拍攝的,相機相對于人、物的正常姿態沒有旋轉。而在圖像識別的過程中,經常存在待識別的圖像在拍攝過程中,因為拍攝時相機存在旋轉角度,而使得待識別圖像中的人、物也存在旋轉角度,進而導致降低圖像識別準確率。
目前,通常的解決方案是通過在相機中設置陀螺儀,陀螺儀會獲取相機拍攝過程時候陀螺儀的方位信息,并將方位信息存儲在拍攝得到的圖像文件頭中。然而,相機中設置陀螺儀會增加設備成本,并且陀螺儀獲取的拍攝角度通常只有4個固定角度,不能對除了這4個角度之外的角度進行細致描述。
發明內容
本申請實施例提出了用于矯正圖像的方法和裝置。
第一方面,本申請實施例提供了一種用于矯正圖像的方法,該方法包括:基于采用束搜索算法執行比值確定操作在預設角度范圍內確定的目標搜索深度和目標束寬度,確定至少一個采樣角度,其中,比值確定操作包括:確定測試樣本集中對應的測試結果為測試通過的測試樣本的數目與測試樣本集中測試樣本數目的比值是否大于預設測試通過比例閾值;響應于確定大于,將初始搜索深度和初始束寬度確定為目標搜索深度和目標束寬度;對于至少一個采樣角度中的每個采樣角度,將目標圖像旋轉該采樣角度,得到與該采樣角度對應的旋轉后圖像;對于所得到的至少一個旋轉后圖像中的每個旋轉后圖像,將該旋轉后圖像輸入預先訓練的非旋轉圖像檢測模型,得到與該旋轉后圖像對應的非旋轉圖像分值,其中,非旋轉圖像檢測模型用于表征圖像與非旋轉圖像分值之間的對應關系;將至少一個旋轉后圖像中對應的非旋轉圖像分值最高的旋轉后圖像確定為與目標圖像對應的矯正后圖像。
在一些實施例中,非旋轉圖像檢測模型是通過如下訓練步驟得到的:確定初始非旋轉目標檢測模型的模型結構和模型參數;獲取訓練樣本集,其中,每個訓練樣本包括訓練樣本圖像和與該訓練樣本圖像對應的至少一個參照物標注結果,訓練樣本圖像包括至少一個非旋轉參照物圖像,參照物標注結果包括參照物標識和參照物位置信息;將訓練樣本集中的訓練樣本中的訓練樣本圖像和對應的參照物標注結果分別作為初始非旋轉目標檢測模型的輸入和期望輸出,利用機器學習方法訓練初始非旋轉目標檢測模型;將訓練得到的初始非旋轉目標檢測模型確定為預先訓練的非旋轉圖像檢測模型。
在一些實施例中,對于所得到的至少一個旋轉后圖像中的每個旋轉后圖像,將該旋轉后圖像輸入預先訓練的非旋轉圖像檢測模型,得到與該旋轉后圖像對應的非旋轉圖像分值,包括:對于所得到的至少一個旋轉后圖像中的每個旋轉后圖像,將該旋轉后圖像輸入預先訓練的非旋轉圖像檢測模型,得到與該旋轉后圖像對應的至少一個參照物檢測結果,參照物檢測結果包括參照物標識、檢測到參照物標識所指示的參照物的置信度和參照物位置信息,根據所得到的各個參照物檢測結果中的置信度確定與該旋轉后圖像對應的非旋轉圖像分值。
在一些實施例中,根據所得到的各個參照物檢測結果中的置信度確定與該旋轉后圖像對應的非旋轉圖像分值,包括:將所得到的各個參照物檢測結果中的置信度中的最大值確定為與該旋轉后圖像對應的非旋轉圖像分值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811139640.5/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





