[發明專利]一種實時吸煙打電話識別方法有效
| 申請號: | 202110207092.0 | 申請日: | 2021-02-24 |
| 公開(公告)號: | CN112818913B | 公開(公告)日: | 2023-04-07 |
| 發明(設計)人: | 張全;趙磊;彭博;周文俊;張偉;涂然 | 申請(專利權)人: | 西南石油大學 |
| 主分類號: | G06V40/20 | 分類號: | G06V40/20;G06V20/52;G06V10/762;G06V10/774;G06V10/80 |
| 代理公司: | 北京中索知識產權代理有限公司 11640 | 代理人: | 唐亭 |
| 地址: | 610500 四*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 實時 吸煙 打電話 識別 方法 | ||
本發明公開了一種實時吸煙打電話識別方法,包括以下步驟:S1:建立實時吸煙打電話識別模型;S2:根據目標場景的監控視頻,利用多目標追蹤算法定位人行區域;S3:根據所述實時吸煙打電話識別模型,對所述人行區域進行吸煙打電話實時識別。本發明以Se?Res2Block為基礎模塊構建主干網絡,不僅可以融合更多特征還能提高檢測速度;針對小目標識別精度低的問題,增大輸入圖像的分辨率,引入SPP模塊和ASFF模塊,增強上下文之間的信息交互,提高對小目標的識別精度;現有的吸煙打電話方法大多是單幀檢測,誤檢率高,通過多目標追蹤算法引入多幀信息,計算行人區域與手機、香煙矩形框之間的IOU方法可以降低誤檢率,魯棒性更高。
技術領域
本發明涉及計算機視覺中的目標檢測技術領域,特別涉及一種實時吸煙打電話識別方法。
背景技術
吸煙打電話識別在加油站、化工等領域中具有重要的作用。在實際應用中現有的吸煙打電話識別算法存在以下幾個缺點:(1)吸煙打電話檢測一般采用目標檢測算法,比如:SDD、RCNN等,但是這些算法對GPU資源要求較高,增加部署成本;(2)手機、香煙目標小,難以檢測;(3)單幀檢測,誤檢率高,魯棒性低。
發明內容
針對上述問題,本發明旨在提供一種實時吸煙打電話識別方法。
本發明的技術方案如下:
一種實時吸煙打電話識別方法,包括以下步驟:
S1:建立實時吸煙打電話識別模型;
S2:根據目標場景的監控視頻,利用多目標追蹤算法定位人行區域;
S3:根據所述實時吸煙打電話識別模型,對所述人行區域進行吸煙打電話實時識別。
作為優選,步驟S1中,建立所述實時吸煙打電話識別模型具體包括以下子步驟:
S11:采集吸煙打電話圖片數據獲得數據集,對所述數據集中的對象進行標注,并將所述數據集分為訓練集、驗證集和測試集,所述對象包括行人、手機、香煙;
S12:建立改進YOLOV3模型,具體包括以下子步驟:
S121:以Se-Res2Block作為基礎模塊構建輕量級主干網絡;
S122:在所述輕量級主干網絡后引入SPP模塊,并調整輸入圖像的分辨率;
S123:增加ASFF模塊,得到所述改進YOLOV3模型;
S13:將所述訓練集中的數據通過kmeans聚類算法生成anchors,需要生成的anchor數量為9;
S14:將訓練集和驗證集的數據作為改進YOLOV3模型的輸入,訓練和驗證所述改進YOLOV3模型;
S15:將測試集的數據作為所述改進YOLOV3模型的輸入,測試所述改進YOLOV3模型的準確性;當準確性達到目標閾值時,得到所述實時吸煙打電話識別模型。
作為優選,步驟S11中,對數據集中的對象進行標注時,采用yolomark進行標注。
作為優選,步驟S11中,所述訓練集、驗證集和測試集的劃分比例為8:1:1。
作為優選,步驟S121中,所述Se-Res2Block模塊由Res2Bolck模塊和通道注意力機制兩部分組成,且所述通道注意力機制設置在所述Res2Block模塊后。
作為優選,所述輕量級主干網絡包括依次相連的兩個步長為2的3×3卷積,一個瓶頸層,三個Se-Res2Block模塊,卷積核數量為36,一個瓶頸層,三個Se-Res2Block模塊,卷積核數量為72,一個瓶頸層,三個Se-Res2Block模塊,卷積核數量為144。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西南石油大學,未經西南石油大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110207092.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:采用顆粒狀菌種生產平菇菌棒的方法及其專用設備
- 下一篇:一種益智中藥組合物





