[發(fā)明專利]一種基于YOLOv4的泳池溺水檢測方法在審
| 申請?zhí)枺?/td> | 202110488324.4 | 申請日: | 2021-05-06 |
| 公開(公告)號: | CN113158962A | 公開(公告)日: | 2021-07-23 |
| 發(fā)明(設(shè)計(jì))人: | 雷飛;朱恒宇;歐家豪;王蕊;張軒 | 申請(專利權(quán))人: | 北京工業(yè)大學(xué) |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京思海天達(dá)知識產(chǎn)權(quán)代理有限公司 11203 | 代理人: | 沈波 |
| 地址: | 100124 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 yolov4 泳池 溺水 檢測 方法 | ||
本發(fā)明公開了一種基于YOLOv4的泳池溺水檢測方法,通過對YOLOv4檢測模型加入泳池判定線進(jìn)一步約束檢測目標(biāo)類別,提高檢測精度。游泳池布置的水下攝像機(jī)采集游泳池中所有游泳人群的圖像并對其進(jìn)行標(biāo)注,得到專有游泳者數(shù)據(jù)庫;游泳者數(shù)據(jù)庫采用K?means聚類算法得到先驗(yàn)框的尺寸,按照不同尺度聚類出9種尺寸的先驗(yàn)框;構(gòu)建YOLOv4網(wǎng)絡(luò)模型,進(jìn)行迭代訓(xùn)練,直到損失函數(shù)收斂,保存訓(xùn)練好的網(wǎng)絡(luò)模型;將上述訓(xùn)練好的網(wǎng)絡(luò)模型加入泳池判定線模型,使模型對識別到的目標(biāo)類別可以進(jìn)行再一次判定;輸出符合要求的YOLOv4?泳池判定線檢測模型;使用YOLOv4?泳池判定線檢測模型對水下序列圖像進(jìn)行目標(biāo)檢測。本發(fā)明檢測速度快,準(zhǔn)確度高,溺水檢測誤報(bào)率低,滿足實(shí)時(shí)監(jiān)控的要求。
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)視覺人工智能技術(shù),特別是涉及一種基于YOLOv4的泳池溺水檢測方法。
背景技術(shù)
隨著國民的運(yùn)動(dòng)健身意識的覺醒,游泳成為了人們最喜歡的運(yùn)動(dòng)之一。但與此同時(shí)泳池溺水事故呈現(xiàn)出高發(fā)態(tài)勢,一旦發(fā)生溺水事件,救生員往往難以在第一時(shí)間察覺并作出反應(yīng)。所以研究怎樣才能及時(shí)的發(fā)現(xiàn),救助溺水者,有著重大的現(xiàn)實(shí)價(jià)值。
對于公共人工游泳館(池)的安全問題,一部分場館使用傳統(tǒng)的人力監(jiān)管模式。每個(gè)游泳池都靠2-4個(gè)救生員時(shí)刻緊盯著水面來預(yù)防和救援溺水人員。但這種監(jiān)管模式,可靠性差、救生員處理突發(fā)事件的能力較弱、溺水者救助速度也很慢,很難有效保證場館內(nèi)的公共安全。再加上人生理?xiàng)l件的限制使得救生員很難保持長時(shí)間的注意力高度集中,長時(shí)間注視泳池水面還會讓救生員出現(xiàn)眩暈狀態(tài)。對于游泳旺季,游泳池經(jīng)常人數(shù)眾多,環(huán)境嘈雜,溺水者在水面上的求救動(dòng)作很難及時(shí)引起救生員的注意,而一旦溺水者沉入水下就更加難以被察覺。另一部分場館使用攝像頭對游泳館內(nèi)部和水下進(jìn)行監(jiān)控,但多為人工監(jiān)視,不僅耗費(fèi)人力,而且監(jiān)視效果會受到人的情緒以及疲勞程度等因素影響,容易出現(xiàn)漏檢現(xiàn)象,對溺水者預(yù)防和救助效果不明顯。
發(fā)明內(nèi)容
本發(fā)明提供一種基于YOLOv4算法的泳池溺水檢測方法,通過對YOLOv4檢測模型加入泳池判定線模型進(jìn)一步約束檢測目標(biāo)類別提高檢測精度,降低溺水者檢測誤報(bào)率,其特征在于,包括以下步驟:
S1:通過游泳池布置的水下攝像機(jī)采集游泳池中所有游泳人群的圖像并對其進(jìn)行標(biāo)注,得到專有游泳者數(shù)據(jù)庫。
S2:游泳者數(shù)據(jù)庫采用K-means聚類算法得到先驗(yàn)框的尺寸,按照不同尺度聚類出9種尺寸的先驗(yàn)框。
S3:在YOLOv4網(wǎng)絡(luò)模型的配置文件中設(shè)置網(wǎng)絡(luò)模型參數(shù),將YOLOv4網(wǎng)絡(luò)結(jié)構(gòu)放入配置好環(huán)境的計(jì)算機(jī)中,使用訓(xùn)練集對預(yù)訓(xùn)練模型進(jìn)行迭代訓(xùn)練,直到損失函數(shù)收斂,保存訓(xùn)練好的網(wǎng)絡(luò)模型。
S4:將上述訓(xùn)練好的網(wǎng)絡(luò)檢測模型加入泳池判定線模型,使模型對識別到的目標(biāo)類別進(jìn)行再一次判定。
S5:輸出符合要求的YOLOv4-泳池判定線檢測模型。
S6:使用步驟S5中符合要求的YOLOv4-泳池判定線檢測模型對序列圖像進(jìn)行目標(biāo)檢測,輸出檢測結(jié)果,并對溺水現(xiàn)象進(jìn)行報(bào)警。
進(jìn)一步的,步驟S1中所述的游泳者數(shù)據(jù)庫,為如下要求:水下攝像機(jī)采集游泳池中游泳人群的視頻,將采集的視頻轉(zhuǎn)化為圖片格式,利用Labelimg軟件標(biāo)注成VOC格式得到得到游泳者數(shù)據(jù)庫,其中游泳者的自由泳、仰泳、蛙泳、蝶泳、跳水、踩水等行為標(biāo)記為正常游泳(swimming),潛水、掙扎、溺水等行為標(biāo)記為溺水(drowning)。
進(jìn)一步的,步驟S3中所述的配置文件,為如下要求:
S3-1:當(dāng)輸入圖像大小為416x416,參數(shù)random為0,batch_size參數(shù)為16,批次細(xì)分subdivision=16,迭代次數(shù)為6000,初始學(xué)習(xí)率為0.001,檢測物體種類為2時(shí),用戶使用cpu訓(xùn)練模型,至少需要2GB內(nèi)存;使用單GPU訓(xùn)練模型,至少需要4GB。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京工業(yè)大學(xué),未經(jīng)北京工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110488324.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 基于深度學(xué)習(xí)的刀閘狀態(tài)識別方法
- 基于YOLOv4算法的智慧執(zhí)法多尺度目標(biāo)檢測方法、裝置、系統(tǒng)及存儲介質(zhì)
- 基于改進(jìn)YOLOv4的遙感影像橋梁目標(biāo)檢測算法
- 混凝土裂縫分割方法及裝置
- 基于YOLOv4-tiny的插板閥開度檢測方法
- 基于YOLOv4的害蟲檢測方法、系統(tǒng)、裝置及可讀存儲介質(zhì)
- 一種基于YOLOv4的航拍小汽車檢測方法
- 一種基于SF-YOLOv4網(wǎng)絡(luò)模型的車輛檢測方法、系統(tǒng)及存儲介質(zhì)
- 基于YOLOv4改進(jìn)的交通標(biāo)志檢測與識別方法
- 一種針對工業(yè)場景基于改進(jìn)YOLOv4的小目標(biāo)檢測方法





