[發(fā)明專利]語(yǔ)音識(shí)別結(jié)果的調(diào)整裝置及方法在審
| 申請(qǐng)?zhí)枺?/td> | 201810352115.5 | 申請(qǐng)日: | 2018-04-18 |
| 公開(kāi)(公告)號(hào): | CN108364650A | 公開(kāi)(公告)日: | 2018-08-03 |
| 發(fā)明(設(shè)計(jì))人: | 趙鑫;陳孝良;蘇少煒;馮大航;常樂(lè) | 申請(qǐng)(專利權(quán))人: | 北京聲智科技有限公司 |
| 主分類號(hào): | G10L15/22 | 分類號(hào): | G10L15/22;G10L15/04;G10L15/05;G06F17/27 |
| 代理公司: | 中科專利商標(biāo)代理有限責(zé)任公司 11021 | 代理人: | 任巖 |
| 地址: | 100086 北京市海淀區(qū)*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 應(yīng)用場(chǎng)景 語(yǔ)音識(shí)別結(jié)果 過(guò)濾模塊 文本數(shù)據(jù) 敏感詞 匹配 調(diào)整裝置 語(yǔ)音信息 場(chǎng)景判斷模塊 語(yǔ)音輸入信息 語(yǔ)音信息轉(zhuǎn)換 智能語(yǔ)音設(shè)備 處理模塊 用戶體驗(yàn) 語(yǔ)義理解 不一致 正確率 去除 刪除 場(chǎng)景 保留 優(yōu)化 | ||
一種語(yǔ)音識(shí)別結(jié)果的調(diào)整裝置及方法,其中,該裝置包括:VAD模塊,將語(yǔ)音輸入信息劃分為句語(yǔ)音信息;ASR模塊,將句語(yǔ)音信息轉(zhuǎn)換為文本數(shù)據(jù);場(chǎng)景判斷模塊,判斷句語(yǔ)音信息的當(dāng)前應(yīng)用場(chǎng)景;句首處理模塊,若該句首詞的應(yīng)用場(chǎng)景與當(dāng)前應(yīng)用場(chǎng)景匹配,則進(jìn)入過(guò)濾模塊;否則去除該句首詞,依次判斷其他詞的應(yīng)用場(chǎng)景是否與當(dāng)前應(yīng)用場(chǎng)景匹配,直至下一個(gè)詞的應(yīng)用場(chǎng)景與當(dāng)前應(yīng)用場(chǎng)景匹配,此時(shí)進(jìn)入過(guò)濾模塊;過(guò)濾模塊,判斷敏感詞的發(fā)生場(chǎng)景是否與當(dāng)前應(yīng)用場(chǎng)景一致,若一致,則保留該文本數(shù)據(jù)中的敏感詞;若不一致,則刪除該文本數(shù)據(jù)中的敏感詞。本發(fā)明能夠優(yōu)化語(yǔ)音識(shí)別結(jié)果,提高語(yǔ)義理解的正確率,增強(qiáng)智能語(yǔ)音設(shè)備的用戶體驗(yàn)。
技術(shù)領(lǐng)域
本發(fā)明涉及語(yǔ)音處理領(lǐng)域,尤其涉及一種語(yǔ)音識(shí)別結(jié)果的調(diào)整裝置及方法。
背景技術(shù)
近兩年,智能語(yǔ)音設(shè)備例如智能音箱作為家庭場(chǎng)景中有效的人工智能交互入口,在國(guó)內(nèi)外市場(chǎng)受到廣泛專注。智能音箱的應(yīng)用使用戶解放了雙手,能夠更加便捷的獲取歌曲、新聞等媒體資源,了解天氣、交通等實(shí)時(shí)情況,和控制家用電器等。智能音箱的產(chǎn)生得益于深度學(xué)習(xí)等人工智能技術(shù)的發(fā)展,其背后涉及到噪聲消除、語(yǔ)音活動(dòng)檢測(cè)(VAD)和自動(dòng)語(yǔ)音識(shí)別(ASR)等多項(xiàng)復(fù)雜技術(shù)。但根據(jù)目前的技術(shù),VAD和ASR都無(wú)法保證100%的正確率,有效提高語(yǔ)音識(shí)別率是保障智能音箱服務(wù)質(zhì)量的關(guān)鍵。
區(qū)別于其他語(yǔ)音識(shí)別的場(chǎng)景,智能音箱具備口語(yǔ)化和多輪對(duì)話的特征,用戶可以通過(guò)多次口語(yǔ)化的表達(dá)控制智能音箱的行為,而現(xiàn)實(shí)情況是很多簡(jiǎn)略的口語(yǔ)化表達(dá)的識(shí)別率不高。此外,在多輪對(duì)話場(chǎng)景下,VAD的誤判可能導(dǎo)致第一句的末尾詞語(yǔ)出現(xiàn)在第二句的開(kāi)頭位置,這種結(jié)果也會(huì)對(duì)智能音箱的行為造成不良影響。另一方面,智能音箱作為獲取信息的入口,應(yīng)該屏蔽色情、政治敏感等內(nèi)容。在實(shí)際應(yīng)用場(chǎng)景下,有些詞語(yǔ)在新聞播報(bào)中是允許的,但在問(wèn)答場(chǎng)景中是禁止的,這就存在一定的問(wèn)題。
發(fā)明內(nèi)容
(一)要解決的技術(shù)問(wèn)題
本發(fā)明的目的在于提供一種語(yǔ)音識(shí)別結(jié)果的調(diào)整裝置及方法,以解決上述的至少一項(xiàng)技術(shù)問(wèn)題。
(二)技術(shù)方案
本發(fā)明的一方面,提供了一種語(yǔ)音識(shí)別結(jié)果的調(diào)整裝置,包括:
VAD模塊,用于判斷語(yǔ)音輸入信息中每句話的終止,將所述語(yǔ)音輸入信息劃分為至少一個(gè)句語(yǔ)音信息;
ASR模塊,用于將所述句語(yǔ)音信息轉(zhuǎn)換為文本數(shù)據(jù);
場(chǎng)景判斷模塊,用于根據(jù)所述文本數(shù)據(jù)以及場(chǎng)景關(guān)聯(lián)詞庫(kù),判斷所述句語(yǔ)音信息的當(dāng)前應(yīng)用場(chǎng)景;
句首處理模塊,用于判斷所述文本數(shù)據(jù)的句首詞的應(yīng)用場(chǎng)景,并與所述當(dāng)前應(yīng)用場(chǎng)景進(jìn)行匹配,若該句首詞的應(yīng)用場(chǎng)景與當(dāng)前應(yīng)用場(chǎng)景匹配,則進(jìn)行過(guò)濾模塊的處理;若所述場(chǎng)景關(guān)聯(lián)詞庫(kù)中不存在句首詞的應(yīng)用場(chǎng)景或者該句首詞的應(yīng)用場(chǎng)景與當(dāng)前應(yīng)用場(chǎng)景不匹配,則去除該句首詞,并依次判斷該文本數(shù)據(jù)中的其他詞的應(yīng)用場(chǎng)景是否與當(dāng)前應(yīng)用場(chǎng)景匹配,直至下一個(gè)詞的應(yīng)用場(chǎng)景與當(dāng)前應(yīng)用場(chǎng)景匹配,進(jìn)行過(guò)濾模塊的處理;
過(guò)濾模塊,用于根據(jù)敏感詞庫(kù),確定該文本數(shù)據(jù)中的敏感詞的發(fā)生場(chǎng)景,判斷該發(fā)生場(chǎng)景是否與當(dāng)前應(yīng)用場(chǎng)景一致,若一致,則保留該文本數(shù)據(jù)中的敏感詞;若不一致,則刪除該文本數(shù)據(jù)中的敏感詞。
在本發(fā)明的一些實(shí)施例中,所述場(chǎng)景判斷模塊根據(jù)所述文本數(shù)據(jù)以及場(chǎng)景關(guān)聯(lián)詞庫(kù),判斷所述語(yǔ)音輸入信息的應(yīng)用場(chǎng)景指,所述場(chǎng)景判斷模塊對(duì)所述文本數(shù)據(jù)進(jìn)行分詞和詞性分析,確定其中的名詞信息;將所述名詞信息與場(chǎng)景關(guān)聯(lián)詞庫(kù)進(jìn)行概率計(jì)算,將概率最大的應(yīng)用場(chǎng)景確定為所述語(yǔ)音輸入信息的應(yīng)用場(chǎng)景。
在本發(fā)明的一些實(shí)施例中,所述場(chǎng)景關(guān)聯(lián)詞庫(kù)用于定義每個(gè)詞的場(chǎng)景分布概率和各應(yīng)用場(chǎng)景的默認(rèn)動(dòng)詞;所述敏感詞庫(kù)用于定義每個(gè)敏感詞的發(fā)生場(chǎng)景。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京聲智科技有限公司,未經(jīng)北京聲智科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810352115.5/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
- 根據(jù)用戶瀏覽的場(chǎng)景切換應(yīng)用場(chǎng)景模式的方法及設(shè)備
- 一種實(shí)現(xiàn)交互應(yīng)用場(chǎng)景的方法及裝置
- 一種應(yīng)用場(chǎng)景創(chuàng)建的檢測(cè)方法及裝置
- 觸摸式電子設(shè)備的接近傳感器參數(shù)調(diào)整方法和系統(tǒng)
- 一種智能家居控制方法及系統(tǒng)
- 電子設(shè)備提示音的設(shè)置方法和電子設(shè)備
- 一種針對(duì)不同應(yīng)用場(chǎng)景的內(nèi)容審核方法及裝置
- 一種基于即時(shí)通訊的多維復(fù)合交互方法
- 語(yǔ)音終端場(chǎng)景控制、應(yīng)用方法、語(yǔ)音終端、云端及系統(tǒng)
- 一種直播中應(yīng)用場(chǎng)景的制作方法及裝置
- 語(yǔ)音識(shí)別系統(tǒng)和方法
- 一種語(yǔ)音識(shí)別設(shè)備的更新方法、裝置及系統(tǒng)
- 一種語(yǔ)音識(shí)別方法及裝置
- 一種基于手機(jī)互聯(lián)的車載語(yǔ)音識(shí)別系統(tǒng)及識(shí)別方法
- 一種基于云計(jì)算與置信度計(jì)算的語(yǔ)音識(shí)別方法與系統(tǒng)
- 增強(qiáng)型語(yǔ)音端點(diǎn)確定
- 一種語(yǔ)音識(shí)別方法
- 提供語(yǔ)音識(shí)別服務(wù)的方法及裝置
- 語(yǔ)音識(shí)別方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 語(yǔ)音識(shí)別方法、設(shè)備、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)及程序產(chǎn)品
- 一種韻律預(yù)測(cè)方法及系統(tǒng)
- 一種基于KNN技術(shù)的語(yǔ)料庫(kù)文本分類方法
- 文本數(shù)據(jù)標(biāo)注方法及裝置、存儲(chǔ)介質(zhì)、電子設(shè)備
- 數(shù)據(jù)采集方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本的處理、文本分類模型的訓(xùn)練方法及裝置
- 文本加密方法及裝置、終端設(shè)備、存儲(chǔ)介質(zhì)
- 文本數(shù)據(jù)處理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 富文本數(shù)據(jù)處理方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 文本分類模型構(gòu)建、文本分類方法及裝置
- 文本匹配方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





