[發明專利]圖像識別方法、裝置、設備、介質及程序產品在審
| 申請號: | 202110721750.8 | 申請日: | 2021-06-28 |
| 公開(公告)號: | CN113378836A | 公開(公告)日: | 2021-09-10 |
| 發明(設計)人: | 張旭東;辛穎;馮原;李超;張濱;王云浩;王曉迪;谷祎;彭巖;龍翔;鄭弘暉;賈壯;韓樹民 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐;馬曉亞 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 識別 方法 裝置 設備 介質 程序 產品 | ||
本公開提供了一種圖像識別方法、裝置、設備、介質及程序產品,涉及人工智能領域,具體涉及計算機視覺和深度學習技術,具體可用于智能交通和智慧城市場景下。該方法的一實施方式包括:獲取待識別圖像;利用預先訓練的圖像識別模型,確定待識別圖像中數字顯示屏的位置;基于數字顯示屏的位置從待識別圖像中分割出數字顯示屏的區域圖像;對數字顯示屏的區域圖像進行識別,得到數字顯示屏的區域圖像中每個字符和每個字符的位置;根據每個字符和每個字符的位置,得到待識別圖像的字符識別結果。
技術領域
本公開涉及計算機領域,涉及人工智能領域,具體涉及計算機視覺和深度學習技術,具體可用于智能交通和智慧城市場景下,尤其涉及一種圖像識別方法、裝置、設備、介質及程序產品。
背景技術
數字顯示屏作為常見的數字顯示設備,其有很廣泛的使用場景;例如,數碼管,該數碼管作為常見的儀表顯示設備,其讀數一般作為質量、溫度、濕度等重要參數的依據,所以它的示數讀取尤為重要。數碼管一般由7段發光發光二極管(Light-Emitting Diode,LED)構成。
目前,識別數字顯示屏中的字符的方法包括人工讀數,以及利用智能設備對數碼管的字符進行識別。
發明內容
本公開實施例提出了一種圖像識別方法、裝置、設備、介質及程序產品。
第一方面,本公開實施例提出了一種圖像識別方法,包括:獲取待識別圖像;利用預先訓練的圖像識別模型,確定待識別圖像中數字顯示屏的位置;基于數字顯示屏的位置從待識別圖像中分割出數字顯示屏的區域圖像;對數字顯示屏的區域圖像進行識別,得到數字顯示屏的區域圖像中每個字符和每個字符的位置;根據每個字符和每個字符的位置,得到待識別圖像的字符識別結果。
第二方面,本公開實施例提出了一種圖像識別裝置,包括:圖像獲取模塊,被配置成獲取待識別圖像;位置確定模塊,被配置成利用預先訓練的圖像識別模型,確定待識別圖像中數字顯示屏的位置;圖像分割模塊,被配置成基于數字顯示屏的位置從待識別圖像中分割出數字顯示屏的區域圖像;位置得到模塊,被配置成對數字顯示屏的區域圖像進行識別,得到數字顯示屏的區域圖像中每個字符和每個字符的位置;結果得到模塊,被配置成根據每個字符和每個字符的位置,得到待識別圖像的字符識別結果。
第三方面,本公開實施例提出了一種電子設備,包括:至少一個處理器;以及與至少一個處理器通信連接的存儲器;其中,存儲器存儲有可被至少一個處理器執行的指令,指令被至少一個處理器執行,以使至少一個處理器能夠執行如第一方面描述的方法。
第四方面,本公開實施例提出了一種存儲有計算機指令的非瞬時計算機可讀存儲介質,計算機指令用于使計算機執行如第一方面描述的方法。
第五方面,本公開實施例提出了一種計算機程序產品,包括計算機程序,計算機程序在被處理器執行時實現如第一方面描述的方法。
第六方面,本公開實施例提出了一種圖像識別系統,包括終端設備的攝像頭、網關,以及第三方面描述的電子設備。
第七方面,本公開實施例提出了一種云控平臺,包括第三方面描述的電子設備。
本公開實施例提供的圖像識別方法、裝置、設備、介質及程序產品,首先獲取待識別圖像;然后,利用預先訓練的圖像識別模型,確定待識別圖像中數字顯示屏的位置;然后,基于數字顯示屏的位置從待識別圖像中分割出數字顯示屏的區域圖像;然后,對數字顯示屏的區域圖像進行識別,得到數字顯示屏的區域圖像中每個字符和每個字符的位置;最后根據每個字符和每個字符的位置,得到待識別圖像的字符識別結果。能夠在對待識別圖像中數字顯示屏之外的背景進行分割之后,再對數字顯示屏的區域圖像中的字符進行識別,以根據每個字符和每個字符的位置,得字符識別結果,從而提高了識別數字顯示屏中字符的準確率。
應當理解,本部分所描述的內容并非旨在標識本公開的實施例的關鍵或重要特征,也不用于限制本公開的范圍。本公開的其它特征將通過以下的說明書而變得容易理解。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110721750.8/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





