[發明專利]基于樸素貝葉斯的彩色圖像二值化方法和系統有效
| 申請號: | 201810869443.2 | 申請日: | 2018-08-02 |
| 公開(公告)號: | CN109086774B | 公開(公告)日: | 2021-09-03 |
| 發明(設計)人: | 李治江;叢林 | 申請(專利權)人: | 武漢大學 |
| 主分類號: | G06K9/38 | 分類號: | G06K9/38;G06K9/62 |
| 代理公司: | 武漢科皓知識產權代理事務所(特殊普通合伙) 42222 | 代理人: | 王琪 |
| 地址: | 430072 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 樸素 貝葉斯 彩色 圖像 二值化 方法 系統 | ||
本發明屬于計算機及信息服務技術領域,涉及一種基于樸素貝葉斯的彩色圖像二值化的方法。本發明通過監督學習的方法,基于樸素貝葉斯理論,實現了對自然場景環境下的彩色圖像中的特定顏色區域的二值化。本發明主要包括從少數原始圖片中獲取正負樣本數據、處理正負樣本數據、通過正負樣本訓練模型、使用建立的模型對圖片進行二值化處理以及必要時的更新數據重訓練等步驟。本發明可廣泛應用于數字圖像的文字提取、圖像分割、目標識別、標注圖像數據等領域。
技術領域
本發明屬于計算機及信息服務技術,特別涉及對彩色數字圖像中特定范圍內的顏色進行二值化處理的方法和系統。
背景技術
圖像的二值化是一種基礎但重要的圖像處理技術,可以將感興趣目標與背景分離。
隨著時代的發展、計算機技術的普及和多媒體技術的演變,數字圖像在我們的工作和生活中體現了越來越重要的作用。數字圖像被廣泛應用在數據記錄、數據傳遞等任務中。隨著數字圖像的大量使用,數字圖像的處理工作也變得越來越重要。其中,顏色是數字圖像最重要的特征之一。作為彩色數字圖像處理中較為重要的一部分,圖像的二值化處理一直受到各方的關注。彩色數字圖像二值化處理的用處很多:文字提取、圖像分割、目標識別和標注圖像數據等。
圖像二值化方法的研究由來已久。一般來說,傳統的二值化方法可以分為兩類:使用全局閾值和使用動態閾值。雖然使用閾值進行二值化在一些領域已經取得了顯著的效果,但是,閾值法二值化通常僅適用于灰度圖像。一些所謂是對彩色圖片進行二值化的方法,實際也是先將彩色圖像轉化為灰度圖像再做二值化。
近年來,隨著機器學習的發展,一些研究者開始用聚類的方法來進行圖像二值化的處理。但是,聚類方法的二值化只能將一張圖像劃分為兩個部分,而不能控制兩個部分對應的顏色。
發明內容
本發明針對現有技術的不足之處,提出了基于樸素貝葉斯的彩色圖像二值化方法。本發明不僅可以直接在彩色圖像上進行二值化處理,而且可以準確控制二值化過程中兩個部分對應的顏色。
本發明基于正負樣本數據訓練出樸素貝葉斯分類的模型,再把彩色圖像中所有像素點在模型中分為兩類,從而實現了圖像的二值化。
本發明提出的一種基于樸素貝葉斯的彩色圖像二值化方法,包括以下步驟:
步驟1,從原始圖片中提取正負樣本,包括:正樣本的提取:在一少部分原始圖片中,人工挑選出感興趣顏色所在區域,然后把區域內所有像素點的BGR顏色值記錄下來,用做訓練用的初始正樣本數據;負樣本的提取:在原始圖片中,以隨機取點的方式,記錄下取到的像素點的BGR值,用做訓練用的初始負樣本;
步驟2,將負樣本中包含的正樣本數據剔除;
步驟3,基于樸素貝葉斯理論和經過步驟2處理后的正負樣本數據,訓練獲得所挑選顏色區域的二值化模型;
步驟4,將原始圖片輸入已訓練的二值化模型中,獲取一張與原始圖片相同尺寸的二值圖像,其中,與所挑選區域顏色一致的區域為白色,其它區域為黑色。
進一步的,步驟1中初始負樣本的數量應多于初始正樣本的數量。
進一步的,步驟3的具體實現方式如下,
首先,定義如下公式:
其中,P(xi|ym)表示在類別為ym的樣本中,其第i個特征值為xi的樣本所占的比例;Dm,i表示訓練樣本中屬于ym類別且第i個特征值為xi的樣本的數量;Dm表示訓練樣本中,屬于ym類別的樣本的數量,n為類別總數,取值n為2;α為先驗平滑因子;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢大學,未經武漢大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810869443.2/2.html,轉載請聲明來源鉆瓜專利網。





