[發明專利]多音字處理方法、裝置、電子設備及存儲介質在審
| 申請號: | 202110254598.7 | 申請日: | 2021-03-09 |
| 公開(公告)號: | CN113052179A | 公開(公告)日: | 2021-06-29 |
| 發明(設計)人: | 王田;王曉斐;高群 | 申請(專利權)人: | 安徽淘云科技股份有限公司 |
| 主分類號: | G06K9/34 | 分類號: | G06K9/34 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 熊永強 |
| 地址: | 230031 安徽省合肥市高新區習友*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 多音 字處理 方法 裝置 電子設備 存儲 介質 | ||
本申請公開了一種多音字處理方法、裝置、電子設備及存儲介質,該方法包括:獲取掃描圖像,對所述掃描圖像進行切行,得到目標圖像,對所述目標圖像進行識別,得到所述至少一個注音和所述多個文字,基于所述至少一個注音,從所述多個文字中確定所述每個注音對應的多音字。本申請通過掃描和識別文本中的注音來確定文本中的多音字,能夠解決無法識別文本中的多音字注音的問題,提高文本的識別效果。
技術領域
本申請涉及計算機技術領域,尤其涉及一種多音字處理方法、裝置、電子設備及存儲介質。
背景技術
隨著電子技術的發展,電子設備的種類也越來越豐富。掃描筆又名微型掃描儀或手刮式掃描筆,是一種手持式的電子設備。將掃描筆的筆尖掃過書刊、報紙上的文字時,通過內置的光學字符識別(Optical Character Recognition,OCR)模塊能夠對書刊、報紙上的文字進行識別、存儲、編輯等操作。對于識別到的文字,掃描筆通過內置的發音(Text ToSpeech,TTS)模塊和翻譯模塊,能夠將文字讀出來并進行翻譯。多音字,是指一個字有兩個或兩個以上的讀音,不同的讀音表義不同,用法不同,詞性也往往不同。讀音有區別詞性和詞義的作用;根據使用情況不同,讀音也不同,讀音有區別用法的作用。
在學生的課本和學習資料中,會存在大量標有注音的多音字,但是現有的掃描筆技術方案中,僅支持文字的掃描與識別,無法識別出待掃描文本中對多音字的注音。因而在這種情形中,掃描筆無法準確的實現語音的合成,無法正確理解語義,無法基于此進行準確的翻譯。
發明內容
本申請實施例提出了一種多音字處理方法裝置、電子設備及存儲介質,能夠支持注音的掃描和識別,從而提高文本的識別效果。
第一方面,本申請實施例提供一種多音字處理方法,所述方法包括:
獲取掃描圖像;
對所述掃描圖像進行切行,得到目標圖像;
對所述目標圖像進行識別,得到所述至少一個注音和所述多個文字;
基于所述至少一個注音,從所述多個文字中確定所述每個注音對應的多音字。
第二方面,本申請實施例提供一種多音字處理裝置,所述裝置包括:
獲取單元,用于獲取掃描圖像;
切行單元,用于對所述掃描圖像進行切行,得到目標圖像,所述目標圖像中包括至少一個注音和多個文字;
識別單元,用于對所述目標圖像進行識別,得到所述至少一個注音和所述多個文字;
確定單元,基于所述至少一個注音,從所述多個文字中確定所述每個注音對應的多音字
第三方面,本申請實施例提供一種電子設備,包括處理器、存儲器、通信接口以及一個或多個程序,其中,上述一個或多個程序被存儲在上述存儲器中,并且被配置由上述處理器執行,上述程序包括用于執行本申請實施例第一方面的任一方法中的步驟的指令。
第四方面,本申請實施例提供了一種計算機可讀存儲介質,其中,上述計算機可讀存儲介質存儲用于電子數據交換的計算機程序,其中,上述計算機程序使得計算機執行如本申請實施例第一方面的任一方法中所描述的部分或全部步驟。
第五方面,本申請實施例提供了一種計算機程序產品,其中,上述計算機程序產品包括存儲了計算機程序的非瞬時性計算機可讀存儲介質,上述計算機程序可操作來使計算機執行如本申請實施例第一方面的任一方法中所描述的部分或全部步驟。該計算機程序產品可以為一個軟件安裝包。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于安徽淘云科技股份有限公司,未經安徽淘云科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110254598.7/2.html,轉載請聲明來源鉆瓜專利網。





