[發明專利]一種基于譜聚類的自然場景漢字分割方法有效

申請號：	201911088817.8	申請日：	2019-11-08
公開（公告）號：	CN111062393B	公開（公告）日：	2021-12-17
發明（設計）人：	趙凡;楊林林;張琳;聞治泉;武吉梅	申請（專利權）人：	西安理工大學
主分類號：	G06K9/34	分類號：	G06K9/34;G06K9/62
代理公司：	西安弘理專利事務所 61214	代理人：	燕肇琪
地址：	710048 陜***	國省代碼：	陜西;61
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種基于譜聚類自然場景漢字分割方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種基于譜聚類的自然場景漢字分割方法，其特征在于，具體按照以下步驟實施：

步驟1、在官方數據集ICDAR2017-RCTW-17、MSRA-TD500、ICDAR2017-MLT下載或拍攝一張包含漢字的彩色場景圖像Img₁，對Img₁進行尺度變換，尺度因子為(s_w,s_h)，其中和得到圖像Img₂，w'和h'分別為圖像Img₂的寬和高，w和h分別為圖像Img₁的寬和高；

步驟2、把圖像Img₂作為輸入，送入文本檢測網絡模型Model_e2e-mlt，得到檢測的文本框集合B'＝{b'_j|j＝1,2,…N1}，其中N1表示文本框總個數，對文本框集合B'中的各個文本框位置和大小根據尺度因子進行尺度變換得到B＝{b_j|j＝1,2,…N1}，b_j表示Img₁中檢測到的第j個文本框，b_j的四個頂點為

步驟3、把Img₁作為輸入，送入顯著圖提取算法Saliency-Processing()，計算得到顯著圖S_Img，把S_Img作為輸入，調用開源的Opencv庫函數mser.detectRegions()，計算得到MSER集合，即字符候選框集合C'＝{c'_i|i＝1,2,…N2}，c'_i表示第i個字符候選框，N2表示字符候選框總個數，為字符候選框c'_i的中心點坐標；

步驟4、利用b_j和c'_i在圖像中的幾何位置關系計算文本框b_j中的字符候選框集合，記為表示第j個文本框b_j中第m個字符候選框；m∈[1,N_j]，N_j表示文本框b_j中包含的字符候選框總個數；

步驟5、設定文本框個數計數器j初始值為1，即j＝1；

步驟6、用文本框b_j中的字符框集構建圖G_j，G_j＝(V_j,E_j)：其中節點集V_j為字符候選框集，即邊集E_j為由各個字符候選框間計算的關系特征值；

步驟7、對圖G_j進行譜聚類分割前的初始化；

步驟8、定義譜聚類類別總個數計數器變量為K，K初始化為

步驟9、把圖G_j＝(V_j,E_j)作為輸入，送入譜聚類分割算法Spectral_Clustering()進行K類分割，得到K類下聚類中心集合和聚類結果集合其中表示第p類的類中心點，表示第p類的字符框集合；表示第p類分割結果中的第q個字符框，Z_p表示第p類分割結果中的字符框總個數；

步驟10、把和作為輸入，送入聚類評價算法Clustering_Evaluation()計算得到K類聚類結果的聚類評價指標

步驟11、根據評價值對最優分類結果變量進行更新：如果則否則保持不變；

步驟12、譜聚類類別個數計數器K加1，即K＝K+1；如果進入步驟9；否則輸出最優的分割結果和最優的聚類個數進入步驟13；

步驟13、把分割結果送入OCR進行識別；

步驟14、j＝j+1；如果j≤N1，進入步驟6；否則結束分割與識別。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。