[發(fā)明專利]一種文本匹配的方法、裝置及終端有效
| 申請?zhí)枺?/td> | 201811308423.4 | 申請日: | 2018-11-05 |
| 公開(公告)號: | CN109299471B | 公開(公告)日: | 2022-12-27 |
| 發(fā)明(設(shè)計)人: | 吳朋書;許曉平;洪湧明 | 申請(專利權(quán))人: | 廣州百田信息科技有限公司 |
| 主分類號: | G06F40/216 | 分類號: | G06F40/216;G06F40/211;G06F16/30 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 羅滿 |
| 地址: | 510520 廣東省廣*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 文本 匹配 方法 裝置 終端 | ||
本申請公開了一種文本匹配的方法、裝置及終端,涉及語音識別技術(shù)領(lǐng)域,該方法包括:將獲取的語音識別文本以及預(yù)設(shè)備選項文本轉(zhuǎn)化為對應(yīng)的拼音字符串;利用字符拆分規(guī)則對各拼音字符串進行拆分,得到語音識別文本字符單元組和各預(yù)設(shè)備選項文本字符單元組;分別計算語音識別文本字符單元組與各預(yù)設(shè)備選項文本字符單元組之間相同字符單元出現(xiàn)的頻次;若頻次中的最大頻次值大于設(shè)定匹配閾值時,將最大頻次值對應(yīng)的預(yù)設(shè)備選項文本作為匹配文本。該方法很大程度還原了語音識別文本中包含的發(fā)音者原來的讀音信息,對語音識別設(shè)備的識別錯誤情況有極高的意圖還原能力,容錯性高,進而提升了后續(xù)文本匹配的準確性和匹配效率。
技術(shù)領(lǐng)域
本申請涉及語音識別技術(shù)領(lǐng)域,特別涉及一種文本匹配的方法、裝置及終端。
背景技術(shù)
目前,語音識別技術(shù)已經(jīng)被各種硬件和軟件載體廣泛使用。例如:在小米公司的小愛同學(xué)系統(tǒng)、百度公司的DuerOS等平臺上開發(fā)語音交互技能或語音加屏幕交互技能。當前對于語音識別后的文本與各備選項文本匹配時,都是直接利用系統(tǒng)返回的識別后文本與各備選項文本進行文本匹配和同音字匹配。
但是,由于存在發(fā)音者因素(普通話讀音不準等)、環(huán)境因素(嘈雜背景)、設(shè)備因素(麥克風收音能力差)等因素,會造成系統(tǒng)錯誤識別,回傳給服務(wù)器錯誤的文本,例如:發(fā)聲者說“第一項”被識別為“腋下”、說“牛腩”被識別位“留白”等。也就是說用于與備選項文本匹配的語音識別文本是不準確的,進而造成后續(xù)匹配結(jié)果的不準確及不可控。
發(fā)明內(nèi)容
本申請的目的是提供一種文本匹配的方法、裝置及終端,能夠很大程度還原了語音識別文本中包含的發(fā)音者原來的讀音信息,對語音識別設(shè)備的能力依賴性低,進而提升了后續(xù)文本匹配的準確性。
為解決上述技術(shù)問題,本申請?zhí)峁┮环N文本匹配的方法,包括:
將獲取的語音識別文本以及預(yù)設(shè)備選項文本轉(zhuǎn)化為對應(yīng)的拼音字符串;
利用字符拆分規(guī)則對各所述拼音字符串進行拆分,得到語音識別文本字符單元組和各所述預(yù)設(shè)備選項文本字符單元組;
分別計算所述語音識別文本字符單元組與各所述預(yù)設(shè)備選項文本字符單元組之間相同字符單元出現(xiàn)的頻次;
若所述頻次中的最大頻次值大于設(shè)定匹配閾值時,將所述最大頻次值對應(yīng)的預(yù)設(shè)備選項文本作為匹配文本。
可選地,所述方法還包括:
將所述語音識別文本以及所述預(yù)設(shè)備選項文本中的數(shù)字替換為對應(yīng)的漢字文本。
可選地,所述將獲取的語音識別文本以及預(yù)設(shè)備選項文本轉(zhuǎn)化為對應(yīng)的拼音字符串,包括:
當所述語音識別文本以及所述預(yù)設(shè)備選項文本包含多音字時,將包含多音字的文本利用pinyin4j算法分別轉(zhuǎn)換為多音字的每個音對應(yīng)的拼音字符串;
當所述語音識別文本以及所述預(yù)設(shè)備選項文本不包含多音字時,將不包含多音字的文本利用所述pinyin4j算法轉(zhuǎn)化為對應(yīng)的拼音字符串。
可選地,所述利用字符拆分規(guī)則對各所述拼音字符串進行拆分,得到語音識別文本字符單元組和各所述預(yù)設(shè)備選項文本字符單元組,包括:
利用聲韻母拆分規(guī)則對各所述拼音字符串進行拆分,得到語音識別文本字符單元組和各所述預(yù)設(shè)備選項文本字符單元組。
可選地,所述利用聲韻母拆分規(guī)則對各所述拼音字符串進行拆分,得到語音識別文本字符單元組和各所述預(yù)設(shè)備選項文本字符單元組,包括:
將各所述拼音字符串按照聲母和韻母結(jié)構(gòu)進行拆分,得到語音識別文本字符單元組和各所述預(yù)設(shè)備選項文本字符單元組;或,
將各所述拼音字符串按照聲母、單韻母以及鼻音對結(jié)構(gòu)進行拆分,得到語音識別文本字符單元組和各所述預(yù)設(shè)備選項文本字符單元組。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣州百田信息科技有限公司,未經(jīng)廣州百田信息科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811308423.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





