[發明專利]標題列表的識別方法、系統、電子設備及存儲介質有效
| 申請號: | 202011291077.0 | 申請日: | 2020-11-18 |
| 公開(公告)號: | CN112101323B | 公開(公告)日: | 2021-02-02 |
| 發明(設計)人: | 宋巖強;李青龍 | 申請(專利權)人: | 北京智慧星光信息技術有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06T5/00;G06T5/30;G06T7/136;G06T7/194 |
| 代理公司: | 北京智宇正信知識產權代理事務所(普通合伙) 11876 | 代理人: | 李明卓 |
| 地址: | 100080 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 標題 列表 識別 方法 系統 電子設備 存儲 介質 | ||
本發明公開了一種標題列表的識別方法、系統、電子設備及存儲介質,該方法包括:獲取應用程序中的待識別圖像的二值化圖像,待識別圖像包含至少一個標題列表;根據漢字的方形形狀特征對二值化圖像進行形態處理,得到所有物體的外輪廓;根據預設段落篩選信息對外輪廓進行篩選去除處理,得到篩選后的外輪廓;根據篩選后的外輪廓得到每一個外輪廓的垂直中心;根據垂直中心計算相鄰外輪廓垂直中心之間的距離;將距離小于預設間距的外輪廓進行遞歸合并,得到待識別圖像中標題列表的所在區域。該方法基于漢字自身形狀連接而成的標題段落視覺特點,采用圖像識別技術的組合,實現了標題位置的識別和精確定位,無需較高配置的軟硬件,降低了對軟硬件的要求。
技術領域
本發明涉及圖像識別技術領域,具體涉及到一種標題列表的識別方法、系統、電子設備及存儲介質。
背景技術
一般的新聞或者閱讀類App的測試,要模擬人的行為操作App,測試軟件的性能響應時間等。
基于安卓模擬器的測試,使用adb命令,需要精確的坐標定位,才能操作完成對安卓手機的編程控制。對于新聞或者閱讀類應用程序(App),需要點擊標題列表頁面的標題才能進入詳情信息頁面,完成后續對文章的各種操作。
而在這類App中標題列表頁一般都帶有大量的圖文混排,或者視頻背景,使得識別并精確定位標題位置成為模擬測試的核心技術問題。
然而,基于機器學習的圖像識別(SSD、YoloV3等算法)需要提供大量的數據集,對識別對象進行預訓練;還需要圖形處理器(Graphic Processing Unit,GPU)等硬件資源,以一般的硬件水平預測時間基本在幾十毫秒左右。
發明內容
有鑒于此,本發明實施例提供了一種標題列表的識別方法、系統、電子設備及存儲介質,以解決現有技術中定位標題對軟硬件要求較高的問題。
為此,本發明實施例提供了如下技術方案:
根據第一方面,本發明實施例提供了一種標題列表的識別方法,包括:獲取應用程序中的待識別圖像的二值化圖像,所述待識別圖像包含至少一個標題列表;根據漢字的方形形狀特征對所述二值化圖像進行形態處理,得到所述二值化圖像中所有物體的外輪廓;根據預設段落篩選信息對所述外輪廓進行篩選去除處理,得到篩選后的外輪廓;根據所述篩選后的外輪廓得到每一個所述外輪廓的垂直中心;根據所述垂直中心計算相鄰外輪廓垂直中心之間的距離;將所述距離小于預設間距的所述外輪廓進行遞歸合并,得到合并后的外輪廓,所述合并后的外輪廓所在區域則為所述待識別圖像中標題列表的所在區域。
可選地,根據漢字的方形形狀特征對所述二值化圖像進行形態處理,得到所述二值化圖像中所有物體的外輪廓,包括:采用預設形狀的扁平核函數對所述二值化圖像進行膨脹處理和腐蝕處理,所述預設形狀是根據漢字的方形形狀特征確定的;對膨脹處理和腐蝕處理后的所述二值化圖像進行橢圓形開運算處理,得到所述二值化圖像中所有物體的外輪廓。
可選地,根據預設段落篩選信息對所述外輪廓進行篩選去除處理的步驟之前,還包括:對所有物體的外輪廓分別進行輪廓提取,得到每一個外輪廓所對應的最小包裹矩形;根據所述最小包裹矩形確定所述最小包裹矩形所對應的寬度、長度和XY坐標。
可選地,所述預設段落篩選信息包括:預設垂直坐標范圍、預設字體寬度、預設字體長度,預設長寬比。
可選地,根據預設段落篩選信息對所述外輪廓進行篩選去除處理的步驟中,包括:將外輪廓的Y坐標與預設垂直坐標范圍進行比較,若Y坐標不在所述預設垂直坐標范圍內,則去除所對應的外輪廓;將寬度與預設字體寬度進行比較,若寬度小于預設字體寬度,則去除所對應的外輪廓;將長度與預設字體長度進行比較,若長度小于預設字體長度,則去除所對應的外輪廓;將長度和寬度的比值與預設長寬比進行比較,若長度和寬度的比值小于預設長寬比,則去除所對應的外輪廓。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京智慧星光信息技術有限公司,未經北京智慧星光信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011291077.0/2.html,轉載請聲明來源鉆瓜專利網。





