[發明專利]電子報頭版頭條新聞位置識別方法及裝置在審
| 申請號: | 202110254309.3 | 申請日: | 2021-03-09 |
| 公開(公告)號: | CN113033338A | 公開(公告)日: | 2021-06-25 |
| 發明(設計)人: | 鄧世杰;劉帆;杜宏;王鳳美 | 申請(專利權)人: | 太極計算機股份有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/38 |
| 代理公司: | 北京細軟智谷知識產權代理有限責任公司 11471 | 代理人: | 牛晴 |
| 地址: | 100020 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 電子報 頭版頭條 新聞 位置 識別 方法 裝置 | ||
1.一種電子報頭版頭條新聞位置識別方法,其特征在于,包括:
獲取電子報頭版的版面圖,并對所述版面圖進行消除報頭區域處理;
對消除報頭區域處理得到的圖像進行灰度化、二值化處理,得到二值化圖像;
逐個像素行計算所述二值化圖像的像素點,根據所述像素點對預創建空白圖片的相應像素行進行特征值賦值,根據每像素行的特征值得到特征向量,根據所述特征向量確定頭版頭條標題所在的區域;
根據所述版面圖確定所述頭版頭條標題所在位置的橫坐標,根據所述頭版頭條區域確定所述頭版頭條標題所在位置的縱坐標,根據所述橫坐標和縱坐標得到所述頭版頭條標題的坐標;
獲取所述版面圖上文章熱區的坐標范圍,并判斷所述坐標是否在坐標范圍內,如果所述坐標在坐標范圍內,將所述文章熱區確定為頭版頭條新聞的位置。
2.根據權利要求1所述的方法,其特征在于,所述獲取電子報頭版的版面圖,并對所述版面圖進行消除報頭區域處理,包括:
獲取電子報頭版的版面圖圖像鏈接并下載,得到版面圖圖像;
獲取所述圖像的長寬像素信息并生成與所述圖像的長寬像素成預設比例的白色矩形塊;
利用所述白色矩形塊對所述版面圖的報頭進行遮蓋。
3.根據權利要求1或2所述的方法,其特征在于,所述對消除報頭區域處理得到的圖像進行灰度化、二值化處理,包括:
對消除報頭區域處理得到的圖像進行灰度處理,得到灰度圖像;
對所述灰度圖像進行二值化處理,得到二值化圖像,將所述二值化圖像確定為二值化圖像。
4.根據權利要求3所述的方法,其特征在于,所述對所述灰度圖像進行二值化處理,包括:
計算所述灰度圖像的所有像素值,將所有像素值與預設像素閾值進行對比;
將像素值大于等于所述預設像素閾值的像素賦值為255,將像素值小于所述預設像素閾值的像素賦值為0,得到二值化圖像。
5.根據權利要求1所述的方法,其特征在于,所述逐個像素行計算所述二值化圖像的像素點,根據所述像素點對預創建空白圖片的相應像素行進行特征值賦值,根據每個像素行的特征值得到特征向量,根據所述特征向量確定頭版頭條標題所在的區域,包括:
創建與所述版面圖長寬相同的空白圖片;
逐個像素行計算所述二值化圖像上的像素點為0的個數,將所述像素點個數大于預設閾值的像素行確認為存在有效信息,并將所述空白圖片上相應像素行的特征值賦值為255,其余像素行的特征值賦值為0,根據每像素行的賦值得到一組特征向量;
計算所述特征向量中連續出現255值的個數,將連續個數最多的像素行構成的區域確定為頭版頭條標題所在的區域。
6.根據權利要求1所述的方法,其特征在于,所述根據所述版面圖確定所述頭版頭條標題所在位置的橫坐標,根據所述頭版頭條標題所在的區域確定所述頭版頭條標題所在位置的縱坐標,包括:
將所述版面圖寬像素的中點值作為所述頭版頭條標題所在位置的橫坐標;
將所述頭版頭條標題所在的區域的最上邊界和最下邊界確定所述頭版頭條標題所在位置的縱坐標。
7.根據權利要求1所述的方法,其特征在于,所述獲取所述版面圖上文章熱區的坐標范圍,包括:
獲取所述版面圖的網頁源碼;
對所述網頁源碼進行解析獲取文章熱區以及文章熱區的路徑;
根據所述文章熱區的路徑獲取所述文章熱區在所述版面圖中的坐標范圍。
8.根據權利要求7所述的方法,其特征在于,
若文章熱區存在多個,逐一匹配驗證,直至所有文章熱區采集完畢。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于太極計算機股份有限公司,未經太極計算機股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110254309.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種磁電空氣能發電機
- 下一篇:一種產品問題處理方法、裝置及設備





