[發(fā)明專利]一種視頻抽油機(jī)啟停的檢測方法在審
| 申請?zhí)枺?/td> | 202011531759.4 | 申請日: | 2020-12-22 |
| 公開(公告)號: | CN112528937A | 公開(公告)日: | 2021-03-19 |
| 發(fā)明(設(shè)計(jì))人: | 吳新濤;郭睿 | 申請(專利權(quán))人: | 嘉洋智慧安全生產(chǎn)科技發(fā)展(北京)有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N20/20 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100020 北京市朝陽區(qū)來廣營中路甲一*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 視頻 抽油機(jī) 檢測 方法 | ||
本發(fā)明涉及圖像目標(biāo)檢測、圖像相似度對比技術(shù)領(lǐng)域,具體地說,涉及一種視頻抽油機(jī)啟停檢測的方法主要包括對給定的抽油機(jī)視頻,先截取成一幀幀的圖片,準(zhǔn)備對圖片中的抽油機(jī)進(jìn)行目標(biāo)檢測;標(biāo)注抽油機(jī)的數(shù)據(jù)集,用來訓(xùn)練Yolov5目標(biāo)檢測模型;用訓(xùn)練好的Yolov5模型對圖片中的抽油機(jī)進(jìn)行檢測,得到抽油機(jī)的Bounding Box,包括左上角(x1,y1)、右下角(x2,y2);在當(dāng)前幀,我們把抽油機(jī)的Bounding Box區(qū)域裁剪出來作為圖片2;定位到當(dāng)前幀前或后T秒的圖片,把該幀對應(yīng)的同位置區(qū)域裁剪出來作為圖片1;用滑動窗口在兩張圖片上取M×N的窗口,計(jì)算每兩個對應(yīng)窗口的相似度,求平均得到兩張圖片總的相似度。該發(fā)明首先從視頻中截取出的兩幀圖片,再對這兩幀圖片進(jìn)行目標(biāo)檢測得到目標(biāo)區(qū)域,對兩個區(qū)域進(jìn)行對比分析來判斷抽油機(jī)的啟停。
技術(shù)領(lǐng)域
本發(fā)明涉及圖像目標(biāo)檢測、圖像相似度對比技術(shù)領(lǐng)域,具體為判斷視頻中抽油機(jī)啟停的方法。
背景技術(shù)
目標(biāo)檢測是計(jì)算機(jī)視覺和數(shù)字圖像處理的一個熱門方向,廣泛應(yīng)用于機(jī)器人導(dǎo)航、智能視頻監(jiān)控、工業(yè)檢測、航空航天等諸多領(lǐng)域,通過計(jì)算機(jī)視覺減少對人力資本的消耗,具有重要的現(xiàn)實(shí)意義。因此,目標(biāo)檢測也就成為了近年來理論和應(yīng)用的研究熱點(diǎn),它是圖像處理和計(jì)算機(jī)視覺學(xué)科的重要分支,也是智能監(jiān)控系統(tǒng)的核心部分,同時(shí)目標(biāo)檢測也是泛身份識別領(lǐng)域的一個基礎(chǔ)性的算法,對后續(xù)的人臉識別、步態(tài)識別、人群計(jì)數(shù)、實(shí)例分割等任務(wù)起著至關(guān)重要的作用。由于深度學(xué)習(xí)的廣泛運(yùn)用,目標(biāo)檢測算法得到了較為快速的發(fā)展。
基于深度學(xué)習(xí)的目標(biāo)檢測任務(wù)可分為兩個關(guān)鍵的子任務(wù):目標(biāo)分類和目標(biāo)定位。目標(biāo)分類任務(wù)負(fù)責(zé)判斷輸入圖像或所選擇圖像區(qū)域(Proposals)中是否有感興趣類別的物體出現(xiàn),輸出一系列帶分?jǐn)?shù)的標(biāo)簽表明感興趣類別的物體出現(xiàn)在輸入圖像或所選擇圖像區(qū)域(Proposals)中的可能性。目標(biāo)定位任務(wù)負(fù)責(zé)確定輸入圖像或所選擇圖像區(qū)域(Proposals)中感興趣類別的物體的位置和范圍,輸出物體的包圍盒、或物體中心、或物體的閉合邊界等,通常使用方形包圍盒,即Bounding Box用來表示物體的位置信息。
目前主流的目標(biāo)檢測算法主要是基于深度學(xué)習(xí)模型,大概可以分成兩大類別:(1)One-Stage目標(biāo)檢測算法,這類檢測算法不需要Region Proposal階段,可以通過一個Stage直接產(chǎn)生物體的類別概率和位置坐標(biāo)值,比較典型的算法有YOLO、SSD和CornerNet;(2)Two-Stage目標(biāo)檢測算法,這類檢測算法將檢測問題劃分為兩個階段,第一個階段首先產(chǎn)生候選區(qū)域(Region Proposals),包含目標(biāo)大概的位置信息,然后第二個階段對候選區(qū)域進(jìn)行分類和位置精修,這類算法的典型代表有R-CNN,F(xiàn)ast R-CNN,F(xiàn)aster R-CNN等。目標(biāo)檢測模型的主要性能指標(biāo)是檢測準(zhǔn)確度和速度,其中準(zhǔn)確度主要考慮物體的定位以及分類準(zhǔn)確度。一般情況下,Two-Stage算法在準(zhǔn)確度上有優(yōu)勢,而One-Stage算法在速度上有優(yōu)勢。不過,隨著研究的發(fā)展,兩類算法都在兩個方面做改進(jìn),均能在準(zhǔn)確度以及速度上取得較好的結(jié)果。
圖像相似度對比算法主要用于判斷兩張圖片的相似度。經(jīng)典的算法比如:
(1)歐氏距離:最常見的距離度量,用于衡量個體在空間上存在的距離,距離越遠(yuǎn)說明個體間的差異越大,衡量的是n維空間中兩個點(diǎn)之間的實(shí)際距離;
(2)余弦距離:余弦相似度用向量空間中兩個向量夾角的余弦值作為衡量兩個個體間差異的大小。兩個向量越相似夾角越小,余弦值越接近1。相比距離度量,余弦相似度更加注重兩個向量在方向上的差異,而非距離或長度上。
(3)漢明距離:漢明距離表示兩個(相同長度)字對應(yīng)位不同的數(shù)量,我們以d(x,y)表示兩個字x,y之間的漢明距離。對兩個字符串進(jìn)行異或運(yùn)算,并統(tǒng)計(jì)結(jié)果為1的個數(shù),那么這個數(shù)就是漢明距離。向量相似度越高,對應(yīng)的漢明距離越小。如10001001和10010001有2位不同。
目前對于給定的抽油機(jī)視頻,無法直觀的判斷該機(jī)器時(shí)運(yùn)行還是停止。
發(fā)明內(nèi)容
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于嘉洋智慧安全生產(chǎn)科技發(fā)展(北京)有限公司,未經(jīng)嘉洋智慧安全生產(chǎn)科技發(fā)展(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011531759.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





