[發(fā)明專利]語音識別文本的字段值糾錯方法、裝置及存儲控制器有效
| 申請?zhí)枺?/td> | 201910247910.2 | 申請日: | 2019-03-29 |
| 公開(公告)號: | CN109977412B | 公開(公告)日: | 2022-12-27 |
| 發(fā)明(設計)人: | 陳釗;趙煒 | 申請(專利權(quán))人: | 北京林業(yè)大學 |
| 主分類號: | G06F40/232 | 分類號: | G06F40/232;G06F40/284;G10L15/26 |
| 代理公司: | 濟南信達專利事務所有限公司 37100 | 代理人: | 李世喆 |
| 地址: | 100083 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音 識別 文本 字段 糾錯 方法 裝置 存儲 控制器 | ||
本發(fā)明提供了一種字段值糾錯方法、裝置、可讀介質(zhì)及存儲控制器,該方法包括:確定包括有若干韻母及其算法編碼的漢字音形編碼規(guī)則;確定包括有若干標準字段值及其韻母編碼向量的標準字段值集合,字段值的韻母編碼向量包括字段值中各漢字的韻母的算法編碼;根據(jù)漢字音形編碼規(guī)則確定待糾錯字段值的韻母編碼向量;根據(jù)待糾錯字段值及各個具有相同漢字個數(shù)的目標標準字段值的韻母編碼向量,分別計算待糾錯字段值和各個目標標準字段值的韻母相似度;有且僅有一標準字段值,待糾錯字段值和該標準字段值的韻母相似度符合相似度條件時,將待糾錯字段值糾正為該標準字段值。本方案是基于預設的標準字段值以實現(xiàn)字段值糾錯,故能夠適用于沒有上下文的情況。
技術(shù)領(lǐng)域
本發(fā)明涉及計算機技術(shù)領(lǐng)域,特別涉及一種字段值糾錯方法、裝置、可讀介質(zhì)及存儲控制器。
背景技術(shù)
語音識別的研究是人工智能領(lǐng)域重要的研究分支。語音識別技術(shù)是實現(xiàn)如何把語音變成機器能理解的文字或命令的技術(shù)。比如,用戶輸入語音后,基于語音識別技術(shù),可以對語音進行識別以將其轉(zhuǎn)換為文字。但是,初步轉(zhuǎn)換出的文字所代表的意思,可能與用戶的本意存在一定差距,故可以將初步轉(zhuǎn)換出的文字進行進一步地糾錯處理,并將糾錯后的文字展示給用戶,以提高語音與文字間的轉(zhuǎn)換準確率。
目前語音識別后的文本糾錯技術(shù),大多數(shù)聚焦于借助于上下文的文本糾錯技術(shù)。
不過,這一糾錯實現(xiàn)方式不適用于沒有上下文的情況。比如,在林業(yè)應用領(lǐng)域,戶外工作人員需要當場往手機中輸入樹種名時,由于手動輸入較為不便,故易選擇語音輸入樹種名,但轉(zhuǎn)換出的結(jié)果大多差強人意。
發(fā)明內(nèi)容
本發(fā)明提供了一種字段值糾錯方法、裝置、可讀介質(zhì)及存儲控制器,能夠適用于沒有上下文的情況。
為了達到上述目的,本發(fā)明是通過如下技術(shù)方案實現(xiàn)的:
第一方面,本發(fā)明提供了一種字段值糾錯方法,確定預設的漢字音形編碼規(guī)則,所述漢字音形編碼規(guī)則包括至少一個韻母,以及每一個所述韻母的算法編碼;
確定預設的標準字段值集合,所述標準字段值集合包括至少一個標準字段值,以及每一個所述標準字段值的韻母編碼向量,其中,字段值的韻母編碼向量包括字段值中每一個漢字的韻母的算法編碼;
還包括:
獲取待糾錯字段值;
根據(jù)所述漢字音形編碼規(guī)則,確定所述待糾錯字段值的韻母編碼向量;
根據(jù)所述待糾錯字段值的韻母編碼向量和各個目標標準字段值的韻母編碼向量,分別計算所述待糾錯字段值和各個所述目標標準字段值的韻母相似度,所述目標標準字段值的漢字個數(shù)等于所述待糾錯字段值的漢字個數(shù);
判斷全部所述目標標準字段值中是否有且僅有一個第一標準字段值,所述待糾錯字段值和所述第一標準字段值的韻母相似度符合預設的相似度條件,若是,將所述待糾錯字段值糾正為所述第一標準字段值。
進一步地,所述漢字音形編碼規(guī)則還包括至少一個聲母,以及每一個所述聲母的算法編碼;
所述標準字段值集合還包括每一個所述標準字段值的聲母韻母編碼向量,其中,字段值的聲母編碼向量包括字段值中每一個漢字的聲母的算法編碼,字段值的聲母韻母編碼向量包括字段值的韻母編碼向量和字段值的聲母編碼向量;
在所述判斷全部所述目標標準字段值中是否有且僅有一個第一標準字段值之后,進一步包括:
若否,根據(jù)所述漢字音形編碼規(guī)則,確定所述待糾錯字段值的聲母韻母編碼向量;
根據(jù)所述待糾錯字段值的聲母韻母編碼向量和各個所述目標標準字段值的聲母韻母編碼向量,分別計算所述待糾錯字段值和各個所述目標標準字段值的聲母韻母相似度;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京林業(yè)大學,未經(jīng)北京林業(yè)大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910247910.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





