[發明專利]多音字的注音方法及計算機存儲介質有效
| 申請號: | 202110392713.7 | 申請日: | 2021-04-13 |
| 公開(公告)號: | CN112989821B | 公開(公告)日: | 2021-08-13 |
| 發明(設計)人: | 汪光璟;賀剛;楊嵩 | 申請(專利權)人: | 北京世紀好未來教育科技有限公司 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/30;G06F16/33;G06N3/02;G06N3/08 |
| 代理公司: | 北京合智同創知識產權代理有限公司 11545 | 代理人: | 李杰;舒道宏 |
| 地址: | 100086 北京市海淀區中*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 多音字 注音 方法 計算機 存儲 介質 | ||
本發明實施例提供一種多音字的注音方法及計算機存儲介質。其中,所述方法包括:對待注音的多音字語句的語義特征進行編碼,獲得多音字語句的第一語義特征信息;基于多音字語句中的多音字的全局位置信息,對第一語義特征信息進行注意力處理,獲得多音字語句的包含全局位置信息的第二語義特征信息;基于多音字語句中的多音字的相對位置信息,對第一語義特征信息進行注意力處理,獲得多音字語句的包含相對位置信息的第三語義特征信息;基于多音字語句的分詞特征信息、第二語義特征信息,以及第三語義特征信息,對多音字語句中的多音字的讀音進行標注,獲得多音字的讀音的標注結果。通過本實施例,能夠有效提高多音字的注音效率和注音準確率。
技術領域
本發明實施例涉及人工智能領域,尤其涉及一種多音字的注音方法及計算機存儲介質。
背景技術
在教學場景下,語言教學系統常常需要對作為中文普通話教學材料或讀物的中文文本中的中文字符進行讀音標注,進行注音后的中文文本通常作為教學拼音讀物或者作為教學場景語音合成系統的輸入。由于常用中文字符存在一定數量的多音字,即同一個漢字在不同語境中具有不同的讀音,例如,“很多人都(dōu)喜歡古都(dū)西安”。多音字的正確注音,對于中文普通話教學材料或讀物的正確性和有效性,具有非常重要的意義。
現有教學場景下的中文普通話文本注音,大多使用人工標注的方式,并由人工根據上下文對文本中的多音字進行注音,或者使用注音工具進行注音,而注音工具在對多音字進行注音時,無法根據文本內容對多音字的讀音做出正確判斷,都是給出一個默認讀音,然后由人工進行多音字讀音校對。
目前,也有一些使用神經網絡模型的方法,對多音字進行讀音標注,這類任務稱為多音字消歧,然而,現有技術仍然存在以下缺點:
(1)每次輸入一句話,只能輸出一個多音字的注音,如果一句話中存在多個多音字,則需要進行多次重復輸入,來完成對所有多音字的注音,因此,會導致注音耗時長,進而導致注音效率低。
(2)對于單字詞的多音字的注音效果較差,比如“為”,由于單字詞只包含一個字,只能在句子中根據上下文語義進行注音,這對于多音字的注音準確率也非常有限。
由此可見,如何有效提高多音字的注音效率和注音準確率成為當前亟待解決的技術問題。
發明內容
有鑒于此,本發明實施例所解決的技術問題之一在于提供一種多音字的注音方法及計算機存儲介質,用以解決上述技術問題至少之一。
本發明實施例提供一種多音字的注音方法。所述方法包括:對待注音的多音字語句的語義特征進行編碼,以獲得所述多音字語句的第一語義特征信息;基于所述多音字語句中的多音字的全局位置信息,對所述多音字語句的第一語義特征信息進行注意力處理,以獲得所述多音字語句的包含所述全局位置信息的第二語義特征信息;基于所述多音字語句中的多音字的相對位置信息,對所述多音字語句的第一語義特征信息進行注意力處理,以獲得所述多音字語句的包含所述相對位置信息的第三語義特征信息;基于所述多音字語句的分詞特征信息、所述第二語義特征信息,以及所述第三語義特征信息,對所述多音字語句中的多音字的讀音進行標注,以獲得所述多音字語句中的多音字的讀音的標注結果。
本發明實施例還提供一種計算機存儲介質,所述計算機存儲介質存儲有可讀程序,所述可讀程序包括:用于對待注音的多音字語句的語義特征進行編碼,以獲得所述多音字語句的第一語義特征信息的指令;用于基于所述多音字語句中的多音字的全局位置信息,對所述多音字語句的第一語義特征信息進行注意力處理,以獲得所述多音字語句的包含所述全局位置信息的第二語義特征信息的指令;用于基于所述多音字語句中的多音字的相對位置信息,對所述多音字語句的第一語義特征信息進行注意力處理,以獲得所述多音字語句的包含所述相對位置信息的第三語義特征信息的指令;用于基于所述多音字語句的分詞特征信息、所述第二語義特征信息,以及所述第三語義特征信息,對所述多音字語句中的多音字的讀音進行標注,以獲得所述多音字語句中的多音字的讀音的標注結果的指令。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京世紀好未來教育科技有限公司,未經北京世紀好未來教育科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110392713.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種快速檢測HLA-B*1502的試劑盒
- 下一篇:一種低壓抽出式開關柜





