[發明專利]自動分詞拼寫的文本識別方法及裝置、存儲介質在審
| 申請號: | 202110231725.1 | 申請日: | 2021-03-02 |
| 公開(公告)號: | CN112989974A | 公開(公告)日: | 2021-06-18 |
| 發明(設計)人: | 趙宏福 | 申請(專利權)人: | 趙宏福 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/20;G06F40/289;G10L13/10;G10L13/08 |
| 代理公司: | 北京鼎真知識產權代理事務所(普通合伙) 11815 | 代理人: | 洪波 |
| 地址: | 100012 北京市朝陽*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 自動 分詞 拼寫 文本 識別 方法 裝置 存儲 介質 | ||
本申請公開了一種自動分詞拼寫的文本識別方法及裝置、存儲介質,所述方法包括:獲取設定類型的文件,對所述文件中的文本進行識別,并確定文本之間的間距,文本之間的行距;根據文本之間的間距,確定出每行文本中是否存在換行;對文本中的詞語進行識別,并提取所識別的詞語;輸出所述詞語,并接收針對所述詞語的調整,將調整后的詞語作為識別的最終詞語;接收針對所述最終詞語的語音輸出參數的設置;根據所述語音輸出參數對所述最終詞語中的文字進行讀音標注,并為讀音設置聲調;接收讀音及聲調標注后的文本,根據文本所標注的讀音、聲調進行語音輸出。本申請提升了其應用廣泛性以及用戶體驗。
技術領域
本申請實施例涉及文本識別及語音輸出技術,尤其涉及一種自動分詞拼寫的文本識別方法及裝置、存儲介質。
背景技術
因疫情原因,很多學校通過網課的方式進行教學。由此,很多例行的學習工作,也交給了家長來跟進。客觀上講,孩子居家上課方式,給家長帶來了較重負擔;比如詞語默寫這一常見的教學方式,是考查學生知識掌握程度的主要手段,這種方法占用時間較長,且詞語朗讀需要不斷重復,要求讀音標準。這對于需要上班的家長而言,造成了極大的困擾。主要原因有,雖然孩子有老人照看,但家中老人的文化水平參差不齊,且因年齡或地域問題,對于書本上的東西理解有偏差,朗讀方式也很難被辨識等。
發明內容
有鑒于此,本申請實施例提供一種自動分詞拼寫的文本識別方法及裝置、存儲介質。
根據本申請的第一方面,提供一種自動分詞拼寫的文本識別方法,包括:
獲取設定類型的文件,對所述文件中的文本進行識別,并確定文本之間的間距,文本之間的行距;
根據文本之間的間距,確定出每行文本中是否存在換行;
對文本中的詞語進行識別,并提取所識別的詞語;
輸出所述詞語,并接收針對所述詞語的調整,將調整后的詞語作為識別的最終詞語;
接收針對所述最終詞語的語音輸出參數的設置;
根據所述語音輸出參數對所述最終詞語中的文字進行讀音標注,并為讀音設置聲調;
接收讀音及聲調標注后的文本,根據文本所標注的讀音、聲調進行語音輸出。
作為一種實現方式,所述方法還包括:
對所述最終文本進行兒化音識別,對識別出的兒化音文本進行兒化音標注;以及,識別所標注的讀音中的重讀、輕讀語音,對重讀、輕度的語音進行標注;
根據所標注的重讀、輕讀或兒化音對文本進行語音輸出。
作為一種實現方式,所述針對所述最終詞語的語音輸出參數的設置,包括:
為所述最終詞語設置語音讀取速度,每個詞語讀取次數,每次間隔時長,讀取順序中的至少之一;
按讀取速度、讀取次數、間隔時長和讀取順序中至少之一對文本進行語音輸出。
作為一種實現方式,所述對所述文件中的文本進行識別,并確定文本之間的間距,文本之間的行距,包括:
識別出所述文件中的文字,確定每個文字的坐標信息;
根據文字的坐標信息,確定文本的坐標關系;
基于所述坐標信息、所述坐標關系,確定文本之間的間距,文本之間的行距;
根據所述坐標信息,確定文本中文字之間的最短間隔和最大間隔,將文字之間間隔小于所述最大間隔的兩個以上文字識別為詞語,并確定所識別的詞語中文字之間的間距與所述最短間隔之間的差值,對所述差值超過設定閾值的詞語進行標示,以提示為可疑詞語。
作為一種實現方式,所述獲取設定類型的文件,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于趙宏福,未經趙宏福許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110231725.1/2.html,轉載請聲明來源鉆瓜專利網。





