[發明專利]一種用于不規則圖形的目標檢測技術在審
| 申請號: | 202110316581.X | 申請日: | 2021-03-24 |
| 公開(公告)號: | CN113420774A | 公開(公告)日: | 2021-09-21 |
| 發明(設計)人: | 廖家舟;劉志鵬;郭敬娜 | 申請(專利權)人: | 成都理工大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/08 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 610059 四川*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 不規則 圖形 目標 檢測 技術 | ||
本發明公開了一種用于不規則圖形的目標檢測方法,包括實驗環境和算法研究兩大部分。本發明的實驗平臺為ubuntu16.04操作系統,顯卡為NVIDIA GeForce GTX 1080Ti。算法研究包括對自制數據集進行預處理和訓練模型。整個系統的運行流程為:1.安裝ubuntu16.04操作系統,配置Anaconda版本為Anaconda3,python版本為3.6.5,CUDA版本為10.0,cudnn版本為7.1。TensorFlow?gpu 1.14.0版本以及其他所需要的安裝包。2.對數據集進行預處理操作,該操作在裝有Anaconda環境的pycharm中運行。3.對預處理過后的數據集使用MobileNet_V2_224_fpn算法進行目標檢測。4.通過評價指標在測試集上對該模型進行評價。該發明的主要目的在于提高對不規則物體目標檢測的準確性,增加目標檢測技術的實用性和普遍性,推動人工智能的發展。
技術領域
本發明屬于人工智能領域,涉及到一種目標檢測——不規則圖形的識別與定位技術。
背景技術
隨著21世紀的到來,圖像處理技術被廣泛應用于各行各業中,包括人臉檢測、人體檢測、車輛檢測、路況檢測、海關檢測等等。借助計算機的快速發展,圖像分類和目標檢測技術成為計算機視覺方面兩個重點研究方向。圖像分類就是從一幅圖片中分辨出物體所屬的類別,而目標檢測就是在此基礎上,對該物體進行定位并快速準確地輸出圖像所在的位置。目標檢測技術能對能一張圖片中我們所需要的物體和不需要的物體進行分類,且判斷物體是否存在,若存在,則輸出物體的具體位置。該技術能夠實現對圖像信息的快速歸類,加強對目標的認知和了解。在深度學習大規模應用之前,通常用于關鍵點檢測的傳統方法有兩類,一類是基于參數化模型的方法,另一類是基于多階段迭代的級聯形狀回歸。AlexNet在ImageNet圖像分類挑戰賽上取得大幅度超越第二名的最佳成績,帶動了卷積神經網絡(Convolutional Neural Network,CNN)的發展,關鍵點檢測任務也開始跨越到CNN時代?;贑NN人臉關鍵點檢測方法也可以細分為兩種,一種是使用卷積神經網絡回歸預測關鍵點的坐標,另一種方法是先使用卷積神經網絡回歸關鍵點的高斯熱圖,然后從熱圖中解碼出關鍵點的坐標信息。輕量級神經網絡架構的設計逐漸的進入了人們的視野,受到眾多關注的輕量級模型設計也催生了一批經典的輕量級網絡架構MobileNet-V1和MobileNet-V2,其核心是將標準卷積進行拆分來降低標準卷積的參數量。雖然目標檢測技術已經取得了不錯的進展,然而對于不規則物體的目標檢測較少為人們所應用。因而如何對不規則物體進行準確快速地識別與定位是非常具有研究意義及實用價值的。
發明內容
由于MobileNet算法對目標檢測技術的巨大優勢,本發明提供一種基于該算法的MobileNet_V2_224_fpn不規則圖形的目標檢測系統,已解決現有算法中檢測速度過慢,模型冗余及對重疊目標出現漏檢等問題。其具體方案實施如下:
第一方面,本申請實例提供了一種不規則圖形的目標檢測的方法,包括:
數據集采用自己制作的數據集,共有13000張圖片,包括網頁爬蟲抓取1000張前景,自己拍攝2000張真實場景圖片,1000張目標四邊形圖片,利用腳本生成10000張虛擬圖片,其中訓練集和驗證集占11000張,測試集占2000張。
安裝Anaconda3.0、pycharm2019社區版。
在ubuntu16.04操作系統上下載并安裝CUDA10.0和cudnn7.1。在Anaconda中配置虛擬環境,在虛擬環境中安裝搭建TensorFlow、numpy、pandas、termcolor、tabulate、tqdm、pyarrow、 pyzmq、msgpack、pillow、matplotlib、scipy、opencv-python等程序所需要的包。
對數據集進行預處理,主要是格式轉換,主要是將數據集轉成.txt格式,然后將.txt轉換成.xml格式,再將.xml文件轉換成.int格式和.json格式。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于成都理工大學,未經成都理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110316581.X/2.html,轉載請聲明來源鉆瓜專利網。





