[發(fā)明專利]一種文字識別方法及用戶終端在審
| 申請?zhí)枺?/td> | 201710142076.1 | 申請日: | 2013-05-22 |
| 公開(公告)號: | CN107103319A | 公開(公告)日: | 2017-08-29 |
| 發(fā)明(設計)人: | 李昌竹;汪運斌 | 申請(專利權)人: | 華為終端有限公司 |
| 主分類號: | G06K9/34 | 分類號: | G06K9/34 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 518129 廣東省*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文字 識別 方法 用戶 終端 | ||
技術領域
本發(fā)明涉及通信領域,尤其涉及一種文字識別方法及用戶終端。
背景技術
通常,人們在看書或者報紙的時候會把自己感興趣或者重要的內(nèi)容標記下了,隨著通信的發(fā)展,越來越多的人想通過網(wǎng)絡將自己感興趣的內(nèi)容分享給其他人。
現(xiàn)有的光學字符識別(OCR,Optical Character Recognition)技術,可以將文本內(nèi)容透過光學儀器,如影像掃描儀、傳真機或任何攝影器材,將影像轉(zhuǎn)入計算機、手機等終端,然后對文本內(nèi)容進行識別進而顯示在計算機、手機等終端中。
但是OCR技術只能將整個的圖像中的文字內(nèi)容或者單個詞、字進行識別,而不能對用戶標記的局部區(qū)域內(nèi)容進行識別,從而降低了用戶的體驗。
發(fā)明內(nèi)容
本發(fā)明提供一種文字識別方法及用戶終端,能夠?qū)崿F(xiàn)用戶終端只對標記區(qū)域內(nèi)的標記內(nèi)容進行識別,進而提高了用戶體驗。
本發(fā)明實施例的第一方面提供了文字識別方法,包括:用戶終端對文本進行拍照并生成圖像,所述文本上帶有用戶所做的標記;
所述用戶終端對所述圖像進行識別,并確定所述用戶所做的標記在所述圖像上對應的標記區(qū)域;
所述用戶終端對所述標記區(qū)域中的標記內(nèi)容進行光學字符識別。
結合本發(fā)明實施例的第一方面,在本發(fā)明實施例的第一方面的第一種實施方式中,包括:所述用戶所做的標記為直線、或曲線、或橢圓形、或矩形、或圓形。
結合本發(fā)明實施例的第一方面,或第一方面的第一種實施方式,在本發(fā)明實施例的第一方面的第二種實施方式中,包括:所述用戶終端對所述圖像進行識別的技術為霍夫變換、或鏈碼技術、或不變距技術、或傅里葉描述子技術、或自回歸模式技術。
結合本發(fā)明實施例的第一方面,或第一方面的第一種實施方式,在本發(fā)明實施例的第一方面的第三種實施方式中,所述用戶終端對所述圖像進行識別,并確定所述用戶所做的標記在所述圖像上對應的標記區(qū)域的具體步驟包括:所述用戶終端通過霍夫變換對所述圖像中所述用戶所做的標記進行檢測及定位;
所述用戶終端根據(jù)檢測及定位的結果確定所述標記區(qū)域。
結合本發(fā)明實施例的第一方面的第三種實施方式,在本發(fā)明實施例的第一方面的第四種實施方式中,所述用戶所做的標記為直線時,所述用戶終端通過霍夫變換對所述圖像中的標記進行檢測及定位的具體步驟包括:所述用戶終端將直線對應的公式y(tǒng)=ax+b轉(zhuǎn)換成極坐標公式ρ=xcosθ+ysinθ,其中x,y空間中的點對應在極坐標參數(shù)空間中的正弦曲線;
所述用戶終端選取的x,y坐標系下N個點,將ρ離散化為Nρ個參數(shù)空間,將θ離散化為Nθ個參數(shù)空間,并依據(jù)選取的N個點,算出N個ρ值及與ρ值對應的N個θ值;
所述用戶終端通過累加計數(shù)的方式在算出N個ρ值及與ρ值對應的N個θ值中獲取峰值點(ρ0,θ0);
所述用戶終端依據(jù)所述峰值點(ρ0,θ0)檢測及定位對應x,y坐標系下的直線,所述直線為所述用戶所做的標記。
結合本發(fā)明實施例的第一方面的第四種實施方式,在本發(fā)明實施例的第一方面的第五種實施方式中,所述用戶終端根據(jù)檢測及定位的結果確定所述標記區(qū)域的具體步驟包括:所述用戶終端依據(jù)檢測及定位到的所述直線來確定所述直線上方的文字區(qū)域為標記區(qū)域。
結合本發(fā)明實施例的第一方面的第三種實施方式,在本發(fā)明實施例的第一方面的第六種實施方式中,當所述用戶所做的標記為矩形時,所述用戶終端通過霍夫變換對所述圖像中的標記進行檢測及定位的具體步驟包括:所述用戶終端將所述矩形的邊對應的公式y(tǒng)=ax+b轉(zhuǎn)換成極坐標公式ρ=xcosθ+ysinθ,所述矩形包括四條邊,每條邊對應的x,y坐標空間對應一個極坐標參數(shù)空間,其中x,y坐標空間中的點對應在極坐標參數(shù)空間中的正弦曲線;
所述用戶終端在每條邊對應的x,y坐標系下分別選取M個點,將ρ離散化為Mρ個參數(shù)空間,將θ離散化為Mθ個參數(shù)空間,并依據(jù)在每條邊對應的x,y坐標系下選取的M個點,計算ρ值及與ρ值對應的θ值,所述矩形的一條邊對應算出一組M個ρ值及與ρ值對應的M個θ值;
所述用戶終端將算出的四組M個ρ值及與ρ值對應的M個θ值作為四個累加數(shù)組,通過累加計數(shù)的方式在每一個累加數(shù)組中獲取到一個峰值點,所述一個峰值點對應x,y坐標系中的一條直線,所述四條直線為所述矩形的四條邊;
所述用戶終端依據(jù)矩形的特征從所述累加數(shù)組中查找所述矩形四個頂點,其中所述矩形的特征為矩形的相鄰兩邊夾角為90°和矩形的對邊等長;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為終端有限公司,未經(jīng)華為終端有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710142076.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:通道式連續(xù)捆扎裝置
- 下一篇:視頻會議機器人





