[發(fā)明專利]一種批量化學術圖像自動分割標注裝置和方法有效
| 申請?zhí)枺?/td> | 202110940037.2 | 申請日: | 2021-08-17 |
| 公開(公告)號: | CN113392819B | 公開(公告)日: | 2022-03-08 |
| 發(fā)明(設計)人: | 王帥;唐文忠;馮浩楠;錢程 | 申請(專利權)人: | 北京航空航天大學 |
| 主分類號: | G06V30/413 | 分類號: | G06V30/413;G06V10/28 |
| 代理公司: | 北京天匯航智知識產(chǎn)權代理事務所(普通合伙) 11987 | 代理人: | 黃川;史繼穎 |
| 地址: | 100191*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 批量 化學 圖像 自動 分割 標注 裝置 方法 | ||
本發(fā)明公開了一種批量化學術圖像自動分割標注裝置和方法,包括:圖像獲取模塊,讀取圖像;閾值處理模塊,將圖像轉(zhuǎn)化為灰度圖,并根據(jù)設定閾值進一步轉(zhuǎn)化為二值圖;邊緣提取模塊,在二值圖上尋找閉合輪廓,獲得初始輪廓信息;邊緣過濾模塊,對每一個閉合輪廓做外接矩形,以外接矩形的面積為依據(jù)進行輪廓的篩選,得到符合要求的輪廓信息;邊緣修補模塊,對選定的輪廓進行整合,得到最終合適的輪廓,確定最終的分割區(qū)域;圖像分割模塊,依據(jù)最終確定的分割區(qū)域?qū)D像進行分割,輸出各分割區(qū)域的位置信息并形成標注文件保存下來;類別標注模塊,用于將各分割區(qū)域輸入到卷積神經(jīng)網(wǎng)絡中進行自動分類,生成類別標簽,從而完善標注文件。
技術領域
本發(fā)明涉及一種對論文中的學術圖像按照內(nèi)容進行自動分割并標注的實現(xiàn)方法,特別是在對海量的學術圖像進行批量化的處理過程中,針對學術圖像內(nèi)部排版不規(guī)則、子圖類型繁多等特點,提出的一種能批量化處理,盡量去除文字等干擾因素,只保留子圖像,同時根據(jù)內(nèi)容對子圖像進行分類的圖像自動分割和標注方法。
背景技術
圖像分割是數(shù)字圖像處理和計算機視覺領域中的一項關鍵技術,同時也是圖像分析、圖像識別任務中至關重要的預處理環(huán)節(jié)。在對圖像的研究和應用中,由于人眼的視覺特性,往往只對圖像中的某一部分或某些特定的區(qū)域感興趣,為了便于識別和分析,需要將這些感興趣的區(qū)域提取出來。而圖像分割就是依據(jù)灰度、彩色、空間紋理、幾何形狀等特征把圖像劃分成若干個幾何上互不相交的區(qū)域,使得這些特征在同一區(qū)域內(nèi)表現(xiàn)出一致性或相似性,而在不同區(qū)域間表現(xiàn)出明顯的不同。但是圖像分割技術發(fā)展至今仍然沒有形成一個統(tǒng)一的技術規(guī)范,在不同的實際需求和應用場景下,圖像分割的具體方式都需要進行相應的調(diào)整,所以圖像分割技術還是需要持續(xù)的進行研究。
目前常見的圖像分割任務都是基于自然圖像的,對于出現(xiàn)在論文中的學術圖像并沒有進行充分的研究。不同于自然圖像本身就包含豐富的顏色、形狀、紋理等信息,學術圖像是體現(xiàn)研究成果的載體,特別是在生物醫(yī)學領域,論文作者往往將多張不同類型的圖像通過組合、拼接、排列等方式整合為一張復合圖像進行呈現(xiàn),導致之后在進行圖像匹配分析時存在大量的誤匹配,即不同類型的子圖相互之間存在大量的干擾。要避免這一現(xiàn)象的發(fā)生,關鍵在于將各張子圖從一張復合圖像中分割出來。
針對學術圖像分割這種現(xiàn)實需要,目前的研究還不夠充分,雖然傳統(tǒng)的圖像分割方法如閾值分割法和邊緣檢測分割法對于解決這個問題是可行的,但是對于較為特殊的學術圖像而言,這些方法尚存在一定的局限性或者應用上難以達到令人滿意的效果。
一是學術圖像的閾值難以確定。通常對圖像的操作都是要先將圖像轉(zhuǎn)化為灰度圖,這樣便于后續(xù)的處理,而在學術圖像的應用背景下,需要先將一張圖像中有內(nèi)容的區(qū)域識別出來,其次才是對識別區(qū)域的分析標注。為了加大內(nèi)容區(qū)域和背景的辨別程度,需要對學術圖像進行二值化的處理,而常用的經(jīng)驗閾值并不能良好的區(qū)分內(nèi)容區(qū)域和背景,就拿生物醫(yī)學領域論文中經(jīng)常出現(xiàn)的條帶圖來說,有的條帶圖背景很淺,比較接近于整張圖像背景,所以對于學術圖像的閾值選取需要重新確定。
二是現(xiàn)有方法應用的適應性不是很強。一張學術圖像內(nèi)部可能包含若干張子圖,而這些子圖的布局并不都是有規(guī)律可循的,應用邊緣檢測法雖然能夠?qū)D像內(nèi)有內(nèi)容的區(qū)域描繪檢測出來,但是有時學術圖像并不具備較高的分辨率,也就是說有的學術圖像可能并不是很清晰,會存在一些噪聲點導致圖像的質(zhì)量下降,而邊緣檢測法會將所有有內(nèi)容的區(qū)域都檢測出來,其中會包含一些噪聲點或者出現(xiàn)一些零零散散的區(qū)域,而這些的存在就是干擾,會導致分割效果的下降。所以需要對檢測出來的邊緣輪廓進行合理的篩查,這樣才能過濾掉一些如噪點之類的會對有效內(nèi)容區(qū)域進行干擾的因素,從而提高學術圖像分割的質(zhì)量和準確度。另外,目前還缺乏對于學術圖像的標注數(shù)據(jù)集,對于分割后的圖像進行自動分類也有助于構建學術圖像數(shù)據(jù)集,對于數(shù)據(jù)集也是一種補充。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種能批量化進行的學術圖像自動分割并標注的實現(xiàn)方法,解決學術圖像中廣泛存在的子圖布局不規(guī)則,圖像質(zhì)量較低的問題,以及對現(xiàn)有邊緣檢測方法對于學術圖像存在誤檢、錯檢的情況提出相應的改進措施。具體技術方案如下:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京航空航天大學,未經(jīng)北京航空航天大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110940037.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





