[發(fā)明專利]基于多文種文檔圖像識別的跨文種理解方法有效
申請?zhí)枺?/td> | 201210007729.2 | 申請日: | 2012-01-11 |
公開(公告)號: | CN102609408A | 公開(公告)日: | 2012-07-25 |
發(fā)明(設計)人: | 彭良瑞;丁曉青;蘇冰;劉長松;方馳;文迪 | 申請(專利權)人: | 清華大學 |
主分類號: | G06F17/28 | 分類號: | G06F17/28;G06F17/27;G06K9/20 |
代理公司: | 北京路浩知識產(chǎn)權代理有限公司 11002 | 代理人: | 韓國勝;王瑩 |
地址: | 100084 北京市*** | 國省代碼: | 北京;11 |
權利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關鍵詞: | 基于 多文種 文檔 圖像 識別 跨文種 理解 方法 | ||
技術領域
本發(fā)明涉及文本圖像識別與分析領域,特別是涉及一種基于多文種文檔圖像識別的跨文種理解方法。
背景技術
我國作為一個具有悠久歷史的多民族大國,55個少數(shù)民族約占全國人口總數(shù)的8%,分布在占全國總面積50%-60%的土地上。少數(shù)民族語言分屬漢藏、阿爾泰、南亞、南島和印歐等幾大語系,使用人數(shù)較多且影響較廣的少數(shù)民族文字以蒙古文、藏文、維吾爾文為代表。蒙古文、藏文、維吾爾文是非拉丁字母、非漢字體系的文字,民族文字識別與翻譯理解技術是構建各民族文化信息化交流渠道的重要基礎。
發(fā)明內(nèi)容
(一)要解決的技術問題
本發(fā)明要解決的技術問題是提供一種多文種文檔識別與翻譯理解的跨文種一體化技術,實現(xiàn)各民族文字信息的獲取、保存、交流與轉(zhuǎn)換。
(二)技術方案
為了解決上述技術問題,本發(fā)明提供一種基于多文種文檔圖像識別的跨文種理解方法,其包括以下步驟:
獲取源文種的文檔掃描圖像,通過多文種文檔圖像識別途徑對所述文檔掃描圖像進行處理,以得到源文種識別文本;
對所述源文種識別文本進行分句處理;
利用基于詞的或基于句子的文本翻譯理解模塊對分句處理后的源文種識別文本進行轉(zhuǎn)換,獲得目標文種文本;
對所述文檔掃描圖像、源文種識別文本和目標文種文本進行顯示輸出。
其中,所述多文種文檔圖像識別途徑具體包括:將獲取的所述文檔掃描圖像輸入多文種文檔圖像識別模塊中,對所述文檔掃描圖像依次進行版面分析、文本行切分、字符切分和識別,得到所述文檔掃描圖像的文本代碼。
其中,所述分句處理具體包括:對所述源文種識別文本進行斷句和整理,使得原版式上換行斷開的句子合并,重新從標點符號處斷開文本。
其中,基于詞的源文種識別文本轉(zhuǎn)換具體包括:記源文種為A,目標文種為B,根據(jù)B的檢索詞或指定檢索詞組,從所述文本翻譯理解模塊的文種A-B雙語對照詞典知識庫中查找對應A的詞條或詞條組,在所述源文種識別文本中匹配查詢,并記錄匹配結果。
其中,所述顯示輸出具體包括:將所述匹配結果在所述源文種識別文本中高亮顯示,同時將A和B雙語對照的詞條內(nèi)容列表顯示出來;或者,將所述匹配結果在所述文檔掃描圖像上標記顯示,同時將A和B雙語對照的詞條內(nèi)容列表顯示出來。
其中,基于句子的源文種識別文本轉(zhuǎn)換具體包括:采用基于句子的翻譯模塊,實現(xiàn)句子的翻譯轉(zhuǎn)換。
其中,所述顯示輸出具體包括:將翻譯轉(zhuǎn)換后的目標文種文本與源文種識別文本按句交替顯示。
其中,所述顯示輸出具體還包括:目標文種文本與源文種識別文本按句交替顯示時,在目標文種文本中選中某句時,將該句在所述文檔掃描圖像上標記顯示。
(三)有益效果
上述技術方案所提供的基于多文種文檔圖像識別的跨文種理解方法,能夠?qū)崿F(xiàn)對多文種的文檔掃描圖像進行識別、分句、跨文種理解以及雙語對照圖文顯示,為用戶提供了跨文種的文檔翻譯理解功能,實現(xiàn)各文種、各民族文字信息的獲取、保存、交流與轉(zhuǎn)換功能,便于用戶實現(xiàn)跨文種的文檔理解。
附圖說明
圖1是本發(fā)明實施例的基于多文種文檔圖像識別的跨文種理解方法的流程圖。
具體實施方式
下面結合附圖和實施例,對本發(fā)明的具體實施方式作進一步詳細描述。以下實施例用于說明本發(fā)明,但不用來限制本發(fā)明的范圍。
圖1示出了本實施例的基于多文種文檔圖像識別的跨文種理解方法的流程圖,參照圖示,該方法包括如下步驟:
第一步:獲取源文種的文檔掃描圖像,通過多文種文檔圖像識別途徑對所述文檔掃描圖像進行處理,以得到源文種識別文本;
第二步:對所述源文種識別文本進行分句處理;
第三步:利用基于詞的或基于句子的文本翻譯理解模塊對分句處理后的源文種識別文本進行轉(zhuǎn)換,獲得目標文種文本;
第四步:對所述文檔掃描圖像、源文種識別文本和目標文種文本進行顯示輸出。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學,未經(jīng)清華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210007729.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:正負電壓采樣開關電路及電壓采樣電路
- 下一篇:一種中間體BOPTA的制備方法
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序