[發(fā)明專利]命令詞識別方法及電子設(shè)備和存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202310315247.1 | 申請日: | 2023-03-28 |
| 公開(公告)號: | CN116343772A | 公開(公告)日: | 2023-06-27 |
| 發(fā)明(設(shè)計(jì))人: | 嚴(yán)杰;潘敏;陸一帆;錢彥旻 | 申請(專利權(quán))人: | 思必馳科技股份有限公司 |
| 主分類號: | G10L15/08 | 分類號: | G10L15/08;G06N20/00;G10L15/06;G10L15/10;G10L15/22;G10L19/16 |
| 代理公司: | 北京商專永信知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11400 | 代理人: | 鄧婷婷;黃謙 |
| 地址: | 215123 江蘇省蘇州市蘇*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 命令 識別 方法 電子設(shè)備 存儲 介質(zhì) | ||
本發(fā)明公開一種命令詞識別方法、電子設(shè)備和存儲介質(zhì),其中方法包括:獲取用戶輸入的音頻,對所述音頻進(jìn)行解碼得到解碼結(jié)果;若所述解碼結(jié)果匹配到命令詞表中的某一命令詞,查找所述命令詞表中是否存在與所述某一命令詞的字符串互為前綴子父串的其他命令詞;若所述命令詞表中存在與所述某一命令詞的字符串互為前綴子父串的其他命令詞,則根據(jù)前綴子父串對應(yīng)的解碼配置進(jìn)行后續(xù)解碼。本發(fā)明實(shí)施例通過判斷命令詞詞表中是否含有前綴子父串,如果含有該種子父串則解碼器中使用不同解碼配置,可以實(shí)現(xiàn)減少父串串子串的錯誤,同時沒有增加計(jì)算資源。
技術(shù)領(lǐng)域
本發(fā)明屬于命令詞識別技術(shù)領(lǐng)域,尤其涉及一種命令詞識別方法及電子設(shè)備和存儲介質(zhì)。
背景技術(shù)
隨著越來越多的端側(cè)設(shè)備使用語音命令詞識別,對該技術(shù)的要求也越來越高。端側(cè)設(shè)備由于成本和技術(shù)的限制,往往沒有充裕的計(jì)算資源,同時面對的智能家居,控制面板,物聯(lián)網(wǎng)等場景的命令詞存在許多易混淆詞,提升易混淆詞的識別正確率對用戶體驗(yàn)有著關(guān)鍵作用。采用現(xiàn)有技術(shù)往往對計(jì)算資源要求較高,但是面對低成本芯片往往達(dá)不到這樣的要求,同時易混淆詞有其特殊性無法達(dá)到更好的效果。
對于現(xiàn)有的易混淆詞的識別一些技術(shù)是使用兩級處理模塊,將通過第一識別模塊的結(jié)果再送入第二識別模塊,通過兩級識別提升命令詞識別正確性。基于音頻序列輸入第一識別模塊生成命令詞置信度,基于置信度獲得易混淆詞,將其送入第二識別模塊,進(jìn)一步區(qū)分命令詞,緩解易混淆詞的誤識別問題。現(xiàn)有技術(shù)中在第一識別模塊的計(jì)算結(jié)果基礎(chǔ)上增加模塊二的計(jì)算,勢必會增加計(jì)算占用算力,如果第二識別模塊有比較高實(shí)時率,那么會帶來明顯的計(jì)算延時造成數(shù)據(jù)堵塞,這個實(shí)時系統(tǒng)是不可忍受的,而低實(shí)時率需要芯片有較高的計(jì)算能力,從而支持兩級模塊,這個要求對低成本芯片往往比較苛刻。
發(fā)明人發(fā)現(xiàn):現(xiàn)有的相似技術(shù)需要兩級處理模塊,增加了計(jì)算資源占用;應(yīng)用于實(shí)時系統(tǒng)要求第二識別模塊有較低的實(shí)時率,對于低成本芯片來說該條件比較苛刻,在調(diào)整模塊時沒有涉及針對易混淆詞優(yōu)化的操作。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例旨在至少解決上述技術(shù)問題之一。
第一方面,本發(fā)明實(shí)施例提供一種命令詞識別方法,包括:獲取用戶輸入的音頻,對所述音頻進(jìn)行解碼得到解碼結(jié)果;若所述解碼結(jié)果匹配到命令詞表中的某一命令詞,查找所述命令詞表中是否存在與所述某一命令詞的字符串互為前綴子父串的其他命令詞,其中,前綴字符相同的字符串互為前綴子父串;若所述命令詞表中存在與所述某一命令詞的字符串互為前綴子父串的其他命令詞,則根據(jù)前綴子父串對應(yīng)的解碼配置進(jìn)行后續(xù)解碼;若所述命令詞表中不存在與所述某一命令詞的字符串互為前綴子父串的其他命令詞,則繼續(xù)采用當(dāng)前解碼配置進(jìn)行后續(xù)解碼。
第二方面,本發(fā)明實(shí)施例提供一種電子設(shè)備,其包括:至少一個處理器,以及與所述至少一個處理器通信連接的存儲器,其中,所述存儲器存儲有可被所述至少一個處理器執(zhí)行的指令,所述指令被所述至少一個處理器執(zhí)行,以使所述至少一個處理器能夠執(zhí)行本發(fā)明上述任一項(xiàng)命令詞識別方法。
第三方面,本發(fā)明實(shí)施例提供一種存儲介質(zhì),所述存儲介質(zhì)中存儲有一個或多個包括執(zhí)行指令的程序,所述執(zhí)行指令能夠被電子設(shè)備(包括但不限于計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)讀取并執(zhí)行,以用于執(zhí)行本發(fā)明上述任一項(xiàng)命令詞識別方法。
第四方面,本發(fā)明實(shí)施例還提供一種計(jì)算機(jī)程序產(chǎn)品,所述計(jì)算機(jī)程序產(chǎn)品包括存儲在存儲介質(zhì)上的計(jì)算機(jī)程序,所述計(jì)算機(jī)程序包括程序指令,當(dāng)所述程序指令被計(jì)算機(jī)執(zhí)行時,使所述計(jì)算機(jī)執(zhí)行上述任一項(xiàng)命令詞識別方法。
本發(fā)明實(shí)施例通過判斷命令詞詞表中是否含有前綴子父串,如果含有該種子父串則解碼器中使用不同解碼配置,可以實(shí)現(xiàn)減少父串串子串的錯誤,同時沒有增加計(jì)算資源。
附圖說明
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于思必馳科技股份有限公司,未經(jīng)思必馳科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310315247.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





