[發(fā)明專利]語音處理方法及裝置、以及電子設(shè)備在審
| 申請(qǐng)?zhí)枺?/td> | 201910583851.6 | 申請(qǐng)日: | 2019-06-28 |
| 公開(公告)號(hào): | CN110310632A | 公開(公告)日: | 2019-10-08 |
| 發(fā)明(設(shè)計(jì))人: | 龍海;徐培來;汪俊杰 | 申請(qǐng)(專利權(quán))人: | 聯(lián)想(北京)有限公司 |
| 主分類號(hào): | G10L15/08 | 分類號(hào): | G10L15/08;G10L15/18;G10L15/26;G10L25/87;G10L25/51 |
| 代理公司: | 中科專利商標(biāo)代理有限責(zé)任公司 11021 | 代理人: | 呂朝蕙 |
| 地址: | 100085 北京市海淀*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 冗余信息 語音信息 待處理信息 電子設(shè)備 語音處理 語音處理裝置 意圖信息 音信息 移除 | ||
本公開提供了一種語音處理方法,該方法包括:獲取語音信息;確定語音信息中是否存在冗余信息;在所述語音信息中存在冗余信息的情況下,移除所述冗余信息,得到待處理信息;以及根據(jù)待處理信息,確定針對(duì)語音信息的意圖信息。本公開還提供了一種語音處理裝置、以及一種電子設(shè)備。
技術(shù)領(lǐng)域
本公開涉及一種語音處理方法及裝置、以及電子設(shè)備。
背景技術(shù)
隨著電子設(shè)備的快速發(fā)展,為了提高用戶體驗(yàn),人機(jī)交互的智能化技術(shù)例如語音識(shí)別技術(shù)應(yīng)運(yùn)而生。語音識(shí)別技術(shù)通過監(jiān)聽用戶語音輸入,并識(shí)別分析監(jiān)聽的語音輸入來確定用戶的語音指令,以使得電子設(shè)備能夠根據(jù)該語音指令執(zhí)行相應(yīng)操作,實(shí)現(xiàn)智能化的人機(jī)交互。
現(xiàn)有的語音識(shí)別技術(shù)在監(jiān)聽語音輸入時(shí),往往會(huì)持續(xù)監(jiān)聽,并將持續(xù)監(jiān)聽到的全部語音輸入發(fā)往電子設(shè)備后臺(tái)進(jìn)行識(shí)別處理來確定用戶的語音指令。該技術(shù)中由于冗余語音輸入也會(huì)被識(shí)別處理,會(huì)在一定程度上干擾正確指令的識(shí)別。為了避免冗余語音輸入干擾,現(xiàn)有的語音識(shí)別技術(shù)還可以在預(yù)定時(shí)間未監(jiān)聽到用戶語音輸入,或在監(jiān)聽到用戶的冗余語音輸入(例如“嗯”、“啊”、“這個(gè)”和/或“那個(gè)”等)時(shí)停止監(jiān)聽,將監(jiān)聽到的語音輸入發(fā)往后臺(tái)進(jìn)行識(shí)別處理來確定用戶的語音指令。考慮到冗余語音輸入往往只是用戶的習(xí)慣性表述,而并非表征語音輸入的終止,上述監(jiān)聽到冗余語義輸入而停止監(jiān)聽的方案無疑會(huì)導(dǎo)致有效語音輸入的遺漏,從而影響正確指令的識(shí)別。
發(fā)明內(nèi)容
本公開的一個(gè)方面提供了一種用于提高用戶體驗(yàn)的語音處理方法。該方法包括:獲取語音信息;確定語音信息中是否存在冗余信息;在語音信息中存在冗余信息的情況下,移除冗余信息,得到待處理信息;根據(jù)待處理信息,確定針對(duì)語音信息的意圖信息。
可選地,上述獲取語音信息包括:采用端點(diǎn)檢測模型檢測語音輸入的起始點(diǎn)及語音輸入的終止點(diǎn);以及根據(jù)語音輸入的起始點(diǎn)及語音輸入的終止點(diǎn),獲取得到語音信息。
可選地,檢測語音輸入的終止點(diǎn)包括:響應(yīng)于檢測到語音輸入的起始點(diǎn),確定檢測的語音輸入是否為冗余語音;在確定檢測的語音輸入為冗余語音的情況下,更改端點(diǎn)檢測模型的參數(shù),得到更新后端點(diǎn)檢測模型;以及根據(jù)更新后端點(diǎn)檢測模型,檢測語音輸入的終止點(diǎn)。
可選地,上述端點(diǎn)檢測模型的參數(shù)包括:針對(duì)終止點(diǎn)的等待時(shí)間;上述更改端點(diǎn)檢測模型的參數(shù)包括:增加針對(duì)終止點(diǎn)的等待時(shí)間。
可選地,上述確定語音信息中是否存在冗余信息包括:采用第一語音識(shí)別模型識(shí)別語音信息,確定語音信息中是否存在冗余語音信息。上述確定與語音信息匹配的意圖信息包括:采用第二語音識(shí)別模型識(shí)別待處理信息,得到與待處理信息匹配的待處理文本;以及根據(jù)待處理文本,采用語義理解模型確定與語音信息匹配的意圖信息。其中,冗余信息包括冗余語音信息。
可選地,上述移除冗余信息,得到待處理信息包括:根據(jù)冗余信息的起始點(diǎn)和冗余信息的終止點(diǎn),從語音信息中移除冗余信息。
可選地,上述確定語音信息中是否存在冗余信息包括:采用第二語音識(shí)別模型識(shí)別語音信息,得到與語音信息匹配的語音文本;確定語音文本中是否存在冗余文本;以及在語音文本中存在冗余文本的情況下,確定語音信息中存在冗余信息。上述確定針對(duì)語音信息的意圖信息包括:根據(jù)待處理信息,采用語義理解模型確定與語音信息匹配的意圖信息。
可選地,上述移除冗余信息,得到待處理信息包括:移除語音文本中的冗余文本,得到待處理文本。其中,待處理信息包括待處理文本。
本公開的另一方面提供了一種語音處理裝置,該裝置包括:獲取模塊,用于獲取語音信息;冗余信息確定模塊,用于確定語音信息中是否存在冗余信息;冗余信息移除模塊,用于在語音信息中存在冗余信息的情況下,移除冗余信息,得到待處理信息;以及意圖信息確定模塊,用于根據(jù)待處理信息,確定針對(duì)語音信息的意圖信息。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于聯(lián)想(北京)有限公司,未經(jīng)聯(lián)想(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910583851.6/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 公路運(yùn)輸力量優(yōu)化配置系統(tǒng)
- 清理終端冗余信息的方法及裝置
- 基于信息冗余的變電站信息校驗(yàn)糾錯(cuò)方法
- 基于信息冗余的變電站信息校驗(yàn)糾錯(cuò)方法
- 基于冗余關(guān)系的繼電保護(hù)在線監(jiān)測方法與系統(tǒng)
- 軟獨(dú)立冗余磁盤陣列創(chuàng)建方法及系統(tǒng)
- 一種FC-AE-ASM網(wǎng)絡(luò)數(shù)據(jù)冗余方法
- 一種適用于冗余信息系統(tǒng)的攻擊面建模方法及裝置
- 冗余網(wǎng)絡(luò)中的信息共享方法及裝置、計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 冗余會(huì)話、無線承載建立方法、裝置、節(jié)點(diǎn)、終端及介質(zhì)





