[發明專利]一種苗族服飾圖像語義分割方法在審
| 申請號: | 202111371509.3 | 申請日: | 2021-11-18 |
| 公開(公告)號: | CN114037833A | 公開(公告)日: | 2022-02-11 |
| 發明(設計)人: | 覃琴;馮意;王鑫;許文全;顏靖柯 | 申請(專利權)人: | 桂林電子科技大學 |
| 主分類號: | G06V10/26 | 分類號: | G06V10/26;G06N3/04;G06N3/08 |
| 代理公司: | 桂林市華杰專利商標事務所有限責任公司 45112 | 代理人: | 羅玉榮 |
| 地址: | 541004 廣西*** | 國省代碼: | 廣西;45 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 苗族 服飾 圖像 語義 分割 方法 | ||
本發明公開了一種苗族服飾圖像語義分割方法,其特征在于,包括如下步驟:1)數據增強;2)編碼;3)解碼;4)輔助分支結構;5)實現語義分割。這種方法能提取到少數民族服飾的大尺度高級語義信息,而且提取的特征包含更多低級紋理的重要細節、遷移和融合少數民族服飾之間自相似性與跨尺度相似性的特征,能提高苗族服飾圖像語義分割的準確度。
技術領域
本發明涉及圖像處理和機器視覺技術,具體是一種苗族服飾圖像語義分割方法。
背景技術
少數民族將自己的宗教文化、圖騰文化體現在服飾的紋樣和建筑的裝飾上,這樣不僅起到美化自身的作用,還能夠傳達特殊的文化意義。我國少數民族種類繁多,民族服飾多姿多彩,如何正確、高效地分割少數民族服飾的圖案,對于輔助研究人員研究少數民族文化具有重要的意義。
圖像語義分割Semantic Segmentation是圖像處理和是機器視覺技術中關于圖像理解的重要一環,也是AI領域中一個重要的分支。語義分割即是對圖像中每一個像素點進行分類,確定每個點的類別,如屬于背景、人或車,從而進行區域劃分。目前,語義分割已經被廣泛應用于自動駕駛、無人機落點判定等場景中。
雖然已經有學者對民族服飾圖像進行了研究,但在民族服飾圖像分割的自動優化、提取、分類、識別等方面的研究還很少,這影響了從大量民族服飾圖像中快速檢索和識別。區別于時尚服飾,少數民族服裝具有以下特點:(1)服飾圖案結構復雜;(2)服飾飾品繁多,同時存在很多小飾品;(3)同一款式服飾飾品之間顏色細節屬性差異不大。因此,現有的語義分割模型只能用于時尚服裝識別,難于分割出少數民族服飾局部信息。
服飾圖像的語義分割側重于解析細粒度服飾分割項目,消除服飾標簽的語義信息混淆歧義。現有技術中基于超像素分割和姿態估計模型,提出了一種分割時尚服飾的方法,該方法對分割結果不斷優化,得到了精確的分割結果;基于檢索的模型從帶有標記的時尚圖像數據庫進行模版匹配,找到相似的分割服飾樣式,進而對服飾進行分割;基于一種圖像協同分割的模型,該方法第一階段使用支持向量機迭代圖像和數據庫中的服飾一致區域,并細化圖像所有區域,第二階段通過分割區域的頂點,結合服飾圖像的上下文信息,細化分割區域。然而上述方法只針對時尚服裝分割,并未考慮少數民族服飾結構復雜、佩飾繁多且存在小飾品等因素,影響了少數民族服飾分割圖像的語義分割效果。
為了提高語義分割的準確率,近期的研究側重于采用深度神經網絡來對服飾圖像進行分割。Liang等基于主動模版回歸(ATR)模型,利用深度神經網絡學習每個語義區域的位置和可見性,生成掩碼系數和服飾分割形狀的參數,得到很好地分割結果;Khurana等基于SegNet模型,提出了一種用于時尚服飾圖像分割的雙階段深度神經網絡架構,該架構第一階段使用全卷積網絡分割出了服飾圖像,第二階段利用Gabor提取服飾紋樣特征,確定服飾類型;Guo等利用CPN網絡、MFN網絡、CRN網絡從粗到細分割服飾;Liu等基于K最鄰近KNN(k-nearest neighbor,簡稱KNN)的方法,提出了具有參數匹配的卷積神經網絡(M-CNN)來預測圖像中特定語義的最佳匹配區域置信度和位置信息。雖然目前基于神經網絡的語義分割模型的研究在時尚服飾數據集上取得了一定的成功,但是模型提取的特征向量維度較大,且隨著網絡的層數增加,不同尺度特征信息存在丟失,底層特征與高層屬性間存在語義鴻溝,使得少數民族服飾分割仍然存在以下問題:(1)由于少數民族服飾的結構復雜,現有的服飾分割模型難以描述少數民族服飾的局部細節;(2)少數民族服飾色彩鮮明、紋理圖案多樣、款式種類繁多、飾品豐富,如何解決高層視覺語義屬性與低層特征語義屬性鴻溝,成為了提高分割準確率的關鍵。
發明內容
本發明的目的是針對現有技術的不足,而提供一種苗族服飾圖像語義分割方法。這種方法能提取到少數民族服飾的大尺度高級語義信息,而且提取的特征包含更多低級紋理的重要細節、遷移和融合少數民族服飾之間自相似性與跨尺度相似性的特征,能提高苗族服飾圖像語義分割的準確度。
實現本發明目的的技術方案是:
一種苗族服飾圖像語義分割方法,包括如下步驟:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于桂林電子科技大學,未經桂林電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111371509.3/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





