[發明專利]基于多尺度分形維和神經網絡的機器人視覺圖像分割方法無效
| 申請號: | 201110394096.0 | 申請日: | 2011-12-02 |
| 公開(公告)號: | CN102521831A | 公開(公告)日: | 2012-06-27 |
| 發明(設計)人: | 胡凱;楊樂;劉太磊;曹晶晶;王平;談玲 | 申請(專利權)人: | 南京信息工程大學 |
| 主分類號: | G06T7/00 | 分類號: | G06T7/00;G06N3/02 |
| 代理公司: | 南京經緯專利商標代理有限公司 32200 | 代理人: | 艾中蘭 |
| 地址: | 210044 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 尺度 維和 神經網絡 機器人 視覺 圖像 分割 方法 | ||
技術領域
本發明屬于機器人視覺領域,具體涉及一種基于多尺度分形維數和神經網絡的圖像分割方法。
背景技術
圖像分割被廣泛應用于圖像處理相關的各個領域,其中包括遙感圖像、醫學圖像、交通圖像等等。由于圖像分割技術在圖像處理過程中占有重要的地位,多年來一直受到研究人員的高度重視,至今已提出上千種分割算法。目前,使用比較廣泛的分割算法包括基于閾值的分割方法、基于邊緣的分割方法、基于區域的分割方法等等。其中,對于基于閾值的分割方法,其關鍵問題是確定一個最優閾值,但是當圖像的灰度差異不明顯或不同目標的灰度范圍有重疊時,不能夠確定一個精確地閾值,在實際應用中,該方法通常與其他方法結合使用?;谶吘壍姆指罘椒ㄊ抢貌煌瑓^域間像素灰度不連續的特點檢測出區域間的邊緣,從而實現圖像分割,其難點在于邊緣檢測時抗噪性和檢測精度之間的矛盾。若提高檢測精度,則噪聲產生的偽邊緣會導致不合理的輪廓;若提高抗噪性,則會產生輪廓漏檢和位置偏差?;趨^域的分割方法的實質是把某種相似性質的像素連通,從而構成最終的分割區域,該方法往往會造成圖像的過度分割。圖像分割算法近幾年的發展趨勢是多種特征融合的圖像分割方法,除了利用圖像的顏色特征外,還可以利用圖像的梯度特征,幾何空間特征,變換特征及統計特征等高層次特征,對每個待分割的像素,獲得其對應的特征量,再進行特征的分類。通過多種特征的融合,圖像像素能夠被全面描述,從而得到很好的結果。
發明內容
本發明的目的是提出一種能夠運用于機器人運動導航系統中快速實時的圖像分割方法,該方法采用了圖像小波變換和分形維數相結合的方式進行圖像分割,并且使用了神經網絡的方法區分出所提取特征所屬的圖像區域,能夠實現快速的圖像分割。
本發明具體采用如下技術方案:
一種基于多尺度分形維和神經網絡的機器人視覺圖像分割方法,其特征在于包括如下步驟:
步驟一、分別拍攝天空、道路、樹木的圖像,并對圖像進行一系列的預處理,形成一個圖片訓練庫,所述預處理包括:灰度化、直方圖均衡化、調整圖像尺寸為統一尺寸大小;
步驟二、對圖片訓練庫中每張圖像分別進行小波變換,得到每張圖像的一幅低頻近似圖像和m幅高頻細節圖像,m為正整數;
步驟三、對圖片訓練庫中每張圖像經步驟二得到的m+1幅圖像分別計算差分盒子維數,得到圖片訓練庫中每張圖像對應的m+1維分形特征向量;
步驟四、將圖片訓練庫中每張圖像對應的m+1維分形向量分別作為神經網絡的輸入,輸出為01,10,11,分別對應天空、道路和樹木,訓練神經網絡;
步驟五、將要進行圖像分割的圖片經過步驟一中的預處理,然后使用大小為w,像素點(x.y)為中心的窗口對整幅圖像進行掃描,w取任意大于2的正整數,每個窗口均用步驟三中的方法計算出分形維數,作為像素點(x.y)的分形維特征,將上述分形維特征作為步驟四中經過訓練的神經網絡的輸入,得到該像素所屬類別;
步驟六、將步驟五中已歸類完的三個區域用三個不同的灰度值顯示出來,對圖像中存在的一些由于歸類錯誤而產生的雜小區域,使用數學形態學的方法將其去除。
本發明所具有的有益效果為:利用自然界中不同物體表面紋理分形維數不同的特性,能夠有效的分割出天空,樹木,道路三個不同的區域。另外,在已有神經網絡訓練結果的基礎上進行圖像區域分割可以提高分割的速度,適用于運動過程中的機器人視覺系統。
附圖說明
圖1為本發明圖像分割方法流程圖;
圖2為本發明中計算差分盒子維數的示意圖;
其中,1表示圖像灰度曲面,2表示邊長為r的立方體;
圖3本發明統計圖片庫中圖像;
圖4小波變換結果,其中(a)為低頻相似細節,(b)(c)(d)為高頻細節;
圖5本發明實驗結果,其中(a)為原圖,(b)為分割結果,(c)為平滑后結果。
具體實施方式
下面結合附圖和具體例對本發明作進一步詳細的描述。
如圖1所示,本發明基于多尺度分形維和神經網絡的機器人視覺圖像分割方法包括如下步驟:
步驟(1)、拍攝天空、道路、樹木的圖像各1000張(每種圖像數量以上千張為宜,本具體實施例取1000張),并對其進行一系列的預處理,形成一個圖片訓練庫(如圖3所示),
預處理包括:灰度化、直方圖均衡化、調整圖像尺寸為統一尺寸大小(長寬均為2t,方便后續計算)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京信息工程大學,未經南京信息工程大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110394096.0/2.html,轉載請聲明來源鉆瓜專利網。





