[發(fā)明專(zhuān)利]一種語(yǔ)音識(shí)別文本與命令詞文本匹配的方法及設(shè)備有效
| 申請(qǐng)?zhí)枺?/td> | 201710849743.X | 申請(qǐng)日: | 2017-09-20 |
| 公開(kāi)(公告)號(hào): | CN107564528B | 公開(kāi)(公告)日: | 2020-12-15 |
| 發(fā)明(設(shè)計(jì))人: | 姚佳 | 申請(qǐng)(專(zhuān)利權(quán))人: | 廣東惠禾科技發(fā)展有限公司 |
| 主分類(lèi)號(hào): | G10L15/26 | 分類(lèi)號(hào): | G10L15/26 |
| 代理公司: | 北京超凡志成知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11371 | 代理人: | 呂靜 |
| 地址: | 518000 廣東省深圳市南山區(qū)粵海*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 語(yǔ)音 識(shí)別 文本 命令 匹配 方法 設(shè)備 | ||
本發(fā)明提出了一種語(yǔ)音識(shí)別文本與命令詞文本匹配的方法及設(shè)備,方法包括:獲取通過(guò)語(yǔ)音識(shí)別得到的文本;對(duì)文本進(jìn)行切詞,以生成多個(gè)文本詞;并對(duì)預(yù)設(shè)的命令詞文本進(jìn)行切詞,以生成命令詞;確定與各文本詞相似度最高的命令詞,并以此生成第一對(duì)應(yīng)關(guān)系;基于各最高的相似度確定文本與命令詞文本的詞相似度;確定文本與命令詞文本中每個(gè)字的拼音;確定與文本中每個(gè)字的拼音相似程度最高的命令詞中的字的拼音,并以此生成第二對(duì)應(yīng)關(guān)系;基于各最高的拼音相似度確定文本與命令詞文本的拼音相似度;基于詞相似度與拼音相似度確定文本與命令詞文本的相似度。本方案,無(wú)需標(biāo)注數(shù)據(jù),對(duì)語(yǔ)音識(shí)別錯(cuò)誤的容忍度較高,且保證后續(xù)與命令詞的匹配。
技術(shù)領(lǐng)域
本發(fā)明涉及識(shí)別領(lǐng)域,特別涉及一種語(yǔ)音識(shí)別文本與命令詞文本匹配的方法及設(shè)備。
背景技術(shù)
在目前的語(yǔ)音交互中,首先利用語(yǔ)音識(shí)別技術(shù)將語(yǔ)音識(shí)別為文本,然后再進(jìn)行相應(yīng)的處理,在這個(gè)過(guò)程中,就經(jīng)常需要對(duì)語(yǔ)音識(shí)別的文本與功能命令詞進(jìn)行匹配,確定用戶(hù)的目標(biāo);但是在實(shí)際應(yīng)用中,由于某些功能命令詞過(guò)短、意義不明、不符合常規(guī)表達(dá)等問(wèn)題,會(huì)造成識(shí)別出來(lái)的文本與實(shí)際有較大的差異。
目前,在一般的文本匹配算法中,一般都是直接考慮文本之間的相似度,目前的文本匹配算法的方案有一些:
A,字符串級(jí)別,比如根據(jù)(帶權(quán))編輯距離,檢索模型等;
B,淺層語(yǔ)義級(jí)別,比如在A的基礎(chǔ)上,構(gòu)建相似字典;或是對(duì)文本進(jìn)行依存句法分析等,引入詞序信息進(jìn)行比較;
C,深層語(yǔ)義級(jí)別,基于目前較火的深度學(xué)習(xí)模型,比如RNN,Bi-LSTM,GRU,CNN等進(jìn)行深層語(yǔ)義比較。
現(xiàn)有技術(shù)的客觀(guān)缺點(diǎn):
目前的文本匹配算法在語(yǔ)音識(shí)別文本與命令詞的匹配場(chǎng)景中,其實(shí)并不是很適用。語(yǔ)音識(shí)別出現(xiàn)一定錯(cuò)誤的情況下,基本現(xiàn)有的所有方法都會(huì)出現(xiàn)問(wèn)題;其中,就字符串級(jí)別而言,無(wú)法匹配足夠的語(yǔ)義信息,而且在語(yǔ)音識(shí)別有一定的錯(cuò)誤率的情況下,失效率就會(huì)很高;而對(duì)于淺層語(yǔ)義級(jí)別而言,構(gòu)建依存句法分析之類(lèi)的淺層語(yǔ)義分析,都會(huì)消耗較多的處理時(shí)間,而這個(gè)會(huì)導(dǎo)致整個(gè)線(xiàn)上環(huán)境效率的降低,并不是很實(shí)際;而且基于淺層語(yǔ)義分析,對(duì)于口語(yǔ)化(甚至語(yǔ)音識(shí)別錯(cuò)誤)的表達(dá)方式的適應(yīng)性也存在一定的差異性,而對(duì)于構(gòu)建相似詞典,然后在進(jìn)行字符串級(jí)別的比較層面而言,也一樣無(wú)法解決語(yǔ)音識(shí)別錯(cuò)誤的問(wèn)題;至于深層語(yǔ)義級(jí)別的方式,都需要大量的已標(biāo)注數(shù)據(jù),而在這樣一個(gè)較為新興的領(lǐng)域,標(biāo)注數(shù)據(jù)的獲取難道是極大的,甚至短時(shí)間內(nèi)直接是不可能的。
由此,用戶(hù)在與機(jī)器人交互的過(guò)程中,需要說(shuō)出功能命令詞才能夠匹配,也才可以進(jìn)入到相應(yīng)的功能,但是基于上述方式,語(yǔ)音識(shí)別信息不充分的情況下,語(yǔ)音識(shí)別的結(jié)果會(huì)有較大的偏差。
發(fā)明內(nèi)容
針對(duì)現(xiàn)有技術(shù)中的缺陷,本發(fā)明提出了一種語(yǔ)音識(shí)別文本與命令詞文本匹配的方法及設(shè)備,實(shí)現(xiàn)了能夠更大程度的容忍語(yǔ)音識(shí)別錯(cuò)誤,并保證后續(xù)與命令詞的匹配。
具體的,本發(fā)明提出了以下具體的實(shí)施例:
本發(fā)明實(shí)施例提出了一種語(yǔ)音識(shí)別文本與命令詞文本匹配的方法,應(yīng)用于人機(jī)交互的場(chǎng)景,該方法包括:
獲取通過(guò)語(yǔ)音識(shí)別得到的文本;
對(duì)所述文本進(jìn)行切詞,以生成多個(gè)文本詞;并對(duì)預(yù)設(shè)的命令詞文本進(jìn)行切詞,以生成命令詞;
確定與各所述文本詞相似度最高的命令詞,并以此生成第一對(duì)應(yīng)關(guān)系;其中,在所述第一對(duì)應(yīng)關(guān)系中,所確定的命令詞只對(duì)應(yīng)一個(gè)文本詞;
基于各最高的所述相似度確定所述文本與所述命令詞文本的詞相似度;
確定所述文本與所述命令詞文本中每個(gè)字的拼音;
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于廣東惠禾科技發(fā)展有限公司,未經(jīng)廣東惠禾科技發(fā)展有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710849743.X/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G10L 語(yǔ)音分析或合成;語(yǔ)音識(shí)別;音頻分析或處理
G10L15-00 語(yǔ)音識(shí)別
G10L15-02 .語(yǔ)音識(shí)別的特征提取;識(shí)別單位的選擇
G10L15-04 .分段或字極限檢測(cè)
G10L15-06 .創(chuàng)建基準(zhǔn)模板;訓(xùn)練語(yǔ)音識(shí)別系統(tǒng),例如對(duì)說(shuō)話(huà)者聲音特征的適應(yīng)
G10L15-08 .語(yǔ)音分類(lèi)或檢索
G10L15-20 .專(zhuān)門(mén)適用于不利環(huán)境
- 用于語(yǔ)音處理的方法與系統(tǒng)
- 一種語(yǔ)音識(shí)別測(cè)試系統(tǒng)及方法
- 用于語(yǔ)音識(shí)別的方法和裝置
- 一種語(yǔ)音消毒柜的控制方法及語(yǔ)音消毒柜
- 一種語(yǔ)音處理方法及裝置
- 混合語(yǔ)音識(shí)別方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 語(yǔ)音情緒識(shí)別方法、系統(tǒng)、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 一種具有語(yǔ)音識(shí)別功能的智能語(yǔ)音終端設(shè)備
- 語(yǔ)音增強(qiáng)方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種聲紋鑒定語(yǔ)音重組方法和系統(tǒng)
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識(shí)別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級(jí)連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計(jì)算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 文本生成方法、裝置和電子設(shè)備





