[發明專利]基于人工智能的語音處理方法及裝置有效
| 申請號: | 201611132359.X | 申請日: | 2016-12-09 |
| 公開(公告)號: | CN108231089B | 公開(公告)日: | 2020-11-03 |
| 發明(設計)人: | 王知踐;錢勝 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G10L25/51 | 分類號: | G10L25/51;G10L25/30;G10L25/78;G10L19/00 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 張潤 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 人工智能 語音 處理 方法 裝置 | ||
本發明提出一種基于人工智能的語音處理方法及裝置,其中,方法包括:對待解碼的語音進行靜音檢測,如果檢測出待解碼的語音為靜音語音,截斷待解碼的語音得到目標語音,利用預設的靜音幀的尾部特征重置目標語音的尾部特征,對重置后的目標語音進行CTC解碼處理。本發明中,在待解碼的語音攜帶大量空白幀時,對待解碼的語音進行截斷,并利用靜音幀的尾部特征去替換目標語音的尾部特征,使得目標語音的尾部特征在進行CTC解碼時,可以出現一個CTC尖峰,從而使待解碼的語音中大量空白幀之前所攜帶的文本內容中的最后一個字能夠快速上屏顯示。
技術領域
本發明涉及信息處理技術領域,尤其涉及一種基于人工智能的語音處理方法及裝置。
背景技術
人工智能(Artificial Intelligence),英文縮寫為AI。它是研究、開發用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學。人工智能是計算機科學的一個分支,它企圖了解智能的實質,并生產出一種新的能以人類智能相似的方式做出反應的智能機器,該領域的研究包括機器人、語音識別、圖像識別、自然語言處理和專家系統等。其中,人工智能最重要的方面就是語音識別技術。
目前,用戶可以通過語音輸入用戶試圖表達的文字,如在搜索時進行語音搜索,或者語音輸入聊天內容。在需要將語音內容進行顯示時,多采用基于神經網絡的時序類分類(Connectionist temporal classification,簡稱CTC)模型進行語音解碼。在基于CTC模型的解碼過程,一個詞結束后會對應出現一個CTC尖峰,而在將這個詞在屏幕上進行顯示的時候,需要下一個詞的CTC尖峰的出現后,這個詞才能在屏幕顯現出來。
實際應用中,往往會出現用戶一直長按麥克風錄音而用戶卻未發聲,或者發送的一句話中有很長一段時間的停頓的情況,在這些境況下現有基于CTC模型的解碼過程中,需要等到用戶釋放麥克風,或者這句中停頓的時間過去后,前面內容的最后一個字不能在屏幕進行上屏。
發明內容
本發明旨在至少在一定程度上解決相關技術中的技術問題之一。
為此,本發明的第一個目的在于提出一種基于人工智能的語音處理方法,用于解決在用戶長按麥克風錄音而用戶卻未發聲或者一句話中有很長一段時間的停頓的情況下,現有基于CTC模型的解碼過程中,前面內容的最后一個字不能快速上屏顯示的問題。
本發明的第二個目的在于提出一種基于人工智能的語音處理裝置。
本發明的第三個目的在于提出另一種基于人工智能的語音處理裝置。
本發明的第四個目的在于提出一種非臨時性計算機可讀存儲介質。
本發明的第五個目的在于提出一種計算機程序產品。
為達上述目的,本發明第一方面實施例提出了一種基于人工智能的語音處理方法,包括:
對待解碼的語音進行靜音檢測;
如果檢測出所述待解碼的語音為靜音語音,截斷所述待解碼的語音得到目標語音;
利用預設的靜音幀的尾部特征重置所述目標語音的尾部特征;
對重置后的所述目標語音進行CTC解碼處理。
本發明實施例的基于人工智能的語音處理方法,通過對待解碼的語音進行靜音檢測,如果檢測出待解碼的語音為靜音語音,截斷待解碼的語音得到目標語音,利用預設的靜音幀的尾部特征重置目標語音的尾部特征,對重置后的目標語音進行CTC解碼處理。本實施例中,在待解碼的語音攜帶大量空白幀時,對待解碼的語音進行截斷,并利用靜音幀的尾部特征去替換目標語音的尾部特征,使得目標語音的尾部特征在進行CTC解碼時,可以出現一個CTC尖峰,從而使待解碼的語音中大量空白幀之前所攜帶的文本內容中的最后一個字能夠快速上屏顯示。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611132359.X/2.html,轉載請聲明來源鉆瓜專利網。





