[發明專利]基于行文本框分詞算法的文本內容提取識別方法在審
| 申請號: | 202210588514.8 | 申請日: | 2022-05-26 |
| 公開(公告)號: | CN114937278A | 公開(公告)日: | 2022-08-23 |
| 發明(設計)人: | 馮杰;劉新天;朱明航;孟澤正;張海翔 | 申請(專利權)人: | 浙江理工大學 |
| 主分類號: | G06V30/413 | 分類號: | G06V30/413;G06V30/414;G06V30/14;G06V30/146;G06V40/10 |
| 代理公司: | 杭州天勤知識產權代理有限公司 33224 | 代理人: | 王琛 |
| 地址: | 310018 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 行文 分詞 算法 文本 內容 提取 識別 方法 | ||
本發明公開了一種基于行文本框分詞算法的文本內容提取識別方法,根據行文本框的位置信息、語義信息、手指坐標信息,使用簡單高效的算法實現提取出距離手指最近的詞語,該算法簡單高效,解決了服務器資源不足的問題。同時本發明使用目標檢測、手部檢測識別、文本檢測、文本識別實現找到手指關鍵點的坐標,檢測出圖片中文本框位置信息,識別出圖片中目標文本框中文字內容,使用現有模型加上后期訓練后,準確度提高,速度變快,可以更好配合手指選詞的算法。
技術領域
本發明屬于計算機視覺及文本識別技術領域,具體涉及一種基于行文本框分詞算法的文本內容提取識別方法。
背景技術
現如今,時代發展的速度迅速,以前80、90后手捧厚重的牛津和新華詞典、挖空心思探尋快速查字典的方法,如今的00、10后的學生已經在使用電子詞典筆查找生詞。一顆Sensor(紅外感光)+MCU+OID算法+會反射紅外光的特殊涂料印刷,這是最基本的一個點讀筆軟硬件架構,就是信號讀取設備+存儲卡+處理芯片+鋪有暗碼的點讀材料+發音設備。點讀技術的關鍵是OID(Optical Identify Digital)編碼和可識別OID編碼的點讀筆,OID是二維光學辨別編碼,通過編碼的不同組合識別不同的內容;點8BFB筆的方法不僅存在價格昂貴,而且還不便于攜帶,操作復雜度高等。若要改進上述操作復雜度、耗時、精確度等問題,需要涉及計算機視覺中的OCR技術、文本內容提取及合并等相關技術,OCR指的是電子設備(如掃描儀或數碼相機)檢查紙上的字符,通過檢測暗、亮的模式確定其形狀,而后利用字符識別方法將形狀翻譯成計算機文字描述的過程,文本框篩選則是根據坐標篩選出相應的文本框。
公開號為CN110705282 A的中國專利提出了一種關鍵詞提取方法,具體地:獲取待進行關鍵詞提取的第一文本;對第一文本進行分詞,得到多個分詞;將多個分詞輸入詞圖模型中,得到每個分詞對應的權重值;根據每個分詞對應的權重值,對第一文本進行關鍵詞提取;其中,詞圖模型用于通過如下方式確定每個分詞的權重值:獲取目標詞圖;在目標詞圖中,確定第一分詞對應的節點與第二分詞對應的節點之間的第一邊權值;在預設詞圖中確定第一分詞對應的節點與第二分詞對應的節點之間的第二邊權值;根據第一邊權值與第二邊權值,確定目標詞圖中的第一分詞對應節點的權重值。該專利技術雖然屬于關鍵詞提取,但卻是通過將獲取到的多個關鍵詞放入神經網絡中進行計算得來的,還是存在一定的錯誤性。
公開號為CN111694946A的中國專利提出了一種文本關鍵詞可視化顯示方法,具體地:接收待稽核文本數據以獲取對應的純文本數據;將純文本數據進行分詞得到對應的分詞結果;將分詞結果進行噪聲詞過濾,得到分詞過濾結果,其包括非噪聲詞分組和噪聲詞分組;將非噪聲詞分組中各分詞進行關鍵詞抽取,得到未超出預設的排名閾值的關鍵詞以組成關鍵詞集合;根據關鍵詞集合中包括的各關鍵詞轉對應化為詞云,將各關鍵詞對應的詞云發送至用戶端以進行顯示。該專利技術是通過對文本進行文本檢測,識別和分詞之后,根據詞語出現的頻率進行排序,然后將高頻的詞語的篩選出來,并發送至用戶端,這樣尋找的關鍵詞不準確,一般會顯示多個關鍵詞。
發明內容
鑒于上述,本發明提供了一種基于行文本框分詞算法的文本內容提取識別方法,利用手指在設備攝像頭下指出想要查看的詞語,以圖片的形式上傳到服務器,通過簡單算法就可以將該詞語提取出來,實現將手指所指行文本框中詞語提取,并且將行文本框中手指所指詞語呈現出來。
一種基于行文本框分詞算法的文本內容提取識別方法,包括如下步驟:
(1)針對關于書本、試卷的文本圖像,先對圖像進行預處理,然后采用現有的文本檢測算法將圖像中所有行文本框的位置信息提取出來;
(2)采用現有的目標檢測模型將指向題目的手部區域以矩形框的形式框選出來,進而在手部區域內檢測出手指各關鍵節點的位置信息;
(3)利用行文本框以及手指關鍵節點的位置信息,將手指指向詞語所在的行文本框提取出來作為目標文本框,并利用現有的文本識別方法識別出目標文本框內的字符內容;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江理工大學,未經浙江理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210588514.8/2.html,轉載請聲明來源鉆瓜專利網。





