[發明專利]一種基于譜聚類的自然場景漢字分割方法有效
| 申請號: | 201911088817.8 | 申請日: | 2019-11-08 |
| 公開(公告)號: | CN111062393B | 公開(公告)日: | 2021-12-17 |
| 發明(設計)人: | 趙凡;楊林林;張琳;聞治泉;武吉梅 | 申請(專利權)人: | 西安理工大學 |
| 主分類號: | G06K9/34 | 分類號: | G06K9/34;G06K9/62 |
| 代理公司: | 西安弘理專利事務所 61214 | 代理人: | 燕肇琪 |
| 地址: | 710048 陜*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 譜聚類 自然 場景 漢字 分割 方法 | ||
1.一種基于譜聚類的自然場景漢字分割方法,其特征在于,具體按照以下步驟實施:
步驟1、在官方數據集ICDAR2017-RCTW-17、MSRA-TD500、ICDAR2017-MLT下載或拍攝一張包含漢字的彩色場景圖像Img1,對Img1進行尺度變換,尺度因子為(sw,sh),其中和得到圖像Img2,w'和h'分別為圖像Img2的寬和高,w和h分別為圖像Img1的寬和高;
步驟2、把圖像Img2作為輸入,送入文本檢測網絡模型Modele2e-mlt,得到檢測的文本框集合B'={b'j|j=1,2,…N1},其中N1表示文本框總個數,對文本框集合B'中的各個文本框位置和大小根據尺度因子進行尺度變換得到B={bj|j=1,2,…N1},bj表示Img1中檢測到的第j個文本框,bj的四個頂點為
步驟3、把Img1作為輸入,送入顯著圖提取算法Saliency-Processing(),計算得到顯著圖SImg,把SImg作為輸入,調用開源的Opencv庫函數mser.detectRegions(),計算得到MSER集合,即字符候選框集合C'={c'i|i=1,2,…N2},c'i表示第i個字符候選框,N2表示字符候選框總個數,為字符候選框c'i的中心點坐標;
步驟4、利用bj和c'i在圖像中的幾何位置關系計算文本框bj中的字符候選框集合,記為表示第j個文本框bj中第m個字符候選框;m∈[1,Nj],Nj表示文本框bj中包含的字符候選框總個數;
步驟5、設定文本框個數計數器j初始值為1,即j=1;
步驟6、用文本框bj中的字符框集構建圖Gj,Gj=(Vj,Ej):其中節點集Vj為字符候選框集,即邊集Ej為由各個字符候選框間計算的關系特征值;
步驟7、對圖Gj進行譜聚類分割前的初始化;
步驟8、定義譜聚類類別總個數計數器變量為K,K初始化為
步驟9、把圖Gj=(Vj,Ej)作為輸入,送入譜聚類分割算法Spectral_Clustering()進行K類分割,得到K類下聚類中心集合和聚類結果集合其中表示第p類的類中心點,表示第p類的字符框集合;表示第p類分割結果中的第q個字符框,Zp表示第p類分割結果中的字符框總個數;
步驟10、把和作為輸入,送入聚類評價算法Clustering_Evaluation()計算得到K類聚類結果的聚類評價指標
步驟11、根據評價值對最優分類結果變量進行更新:如果則否則保持不變;
步驟12、譜聚類類別個數計數器K加1,即K=K+1;如果進入步驟9;否則輸出最優的分割結果和最優的聚類個數進入步驟13;
步驟13、把分割結果送入OCR進行識別;
步驟14、j=j+1;如果j≤N1,進入步驟6;否則結束分割與識別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安理工大學,未經西安理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911088817.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種電力客戶訴求敏感值計算方法
- 下一篇:一種云計算數據處理設備





