[發明專利]音頻信息處理方法、智能終端及語音控制終端在審
| 申請號: | 201710102948.1 | 申請日: | 2017-02-23 |
| 公開(公告)號: | CN106856093A | 公開(公告)日: | 2017-06-16 |
| 發明(設計)人: | 匡濤;任曉楠;崔保磊 | 申請(專利權)人: | 海信集團有限公司 |
| 主分類號: | G10L19/005 | 分類號: | G10L19/005;G10L15/22 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司11138 | 代理人: | 江崇玉 |
| 地址: | 266071 山*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音頻 信息處理 方法 智能 終端 語音 控制 | ||
技術領域
本發明實施例涉及終端技術領域,特別涉及一種音頻信息處理方法、智能終端及語音控制終端。
背景技術
隨著終端技術的發展,諸如智能電視機、智能空調等智能終端已漸漸成為人們生活中必不可少的工具,且為了方便用戶的生活,用戶通常會通過語音控制終端對智能終端進行控制。其中,語音控制終端可以通過藍牙與智能終端進行連接,而語音控制終端對智能終端進行控制的關鍵為:智能終端對語音控制終端發送的音頻信息進行處理。
當用戶通過語音控制終端控制智能終端時,該語音控制終端可以對用戶輸入的語音進行采集,得到音頻數據,并將該音頻數據進行壓縮得到包括多個語音壓縮包的音頻信息。語音控制終端將該音頻信息包括的多個語音壓縮包基于藍牙傳輸協議發送至智能終端,當該智能終端接收到該音頻信息的多個語音壓縮包時,可以對該多個語音壓縮包進行解壓并進行語音識別,從而基于語音識別后得到的信息對該智能終端進行控制。比如,該語音控制終端可以為語音遙控器,該智能終端可以為智能電視機,該語音遙控器可以對用戶輸入的語音進行采集,得到的音頻數據為包括“打開家庭娛樂”這一信息的數據,該語音遙控器可以將該音頻數據進行壓縮得到包括多個語音壓縮包的音頻信息,將該音頻信息基于藍牙傳輸協議發送至該智能電視機。當該智能電視機接收到該音頻信息時,可以對該音頻信息進行解壓并進行語音識別,得到“打開家庭娛樂”的信息,該智能電視機可以基于該信息運行家庭娛樂。
但是通常情況下,為了使智能終端可以實現更多的功能,該智能終端除了通過藍牙與語音控制終端連接,還會通過WIFI(Wireless Fidelity,無線保真)等方式進行網絡連接,因此,智能終端中會使用藍牙模塊和WIFI模塊公用的技術。但由于該藍牙模塊產生的藍牙信號,以及WIFI模塊產生的WIFI信號在信息傳輸過程中使用相同頻段,使得用戶通過語音控制終端控制智能終端時,該WIFI信號會對藍牙信號造成干擾,導致智能終端在接收語音控制終端發送的音頻信息時,該音頻信息中出現語音壓縮包丟失現象。此外,當該音頻信息中丟失的語音壓縮包較多時,智能終端可能無法識別出該音頻信息,從而降低智能終端對音頻信息進行語音識別的正確率,導致無法進行控制操作。
發明內容
為了提高智能終端對音頻信息進行語音識別的正確率,本發明實施例提供了一種音頻信息處理方法、智能終端及語音控制終端。所述技術方案如下:
第一方面,提供了一種基于藍牙傳輸協議的音頻信息處理方法,應用于智能終端中,所述方法包括:
接收語音控制終端發送的音頻信息,所述音頻信息包括至少兩個語音壓縮包和每個語音壓縮包對應的語音壓縮包標識;
基于所述語音壓縮包標識確定所述音頻信息中是否丟失語音壓縮包;
當所述音頻信息中丟失語音壓縮包時,基于與丟失的語音壓縮包相鄰的語音壓縮包的發音信息,在丟失語音壓縮包的位置處添加語音補償信息,得到優化音頻信息,所述語音補償信息為能夠與所述相鄰的至少一個語音壓縮包的發音信息實現平滑過渡的音頻信息;
對所述優化音頻信息進行語音識別。
可選地,所述基于所述語音壓縮包標識確定所述音頻信息中是否丟失語音壓縮包,包括:
將所述語音壓縮包標識按照大小順序進行排序;
判斷排序后的語音壓縮包標識是否符合指定規則,所述指定規則用于描述所述語音壓縮包標識的排序結果;
當所述排序后的語音壓縮包標識符合所述指定規則時,確定所述音頻信息未丟失語音壓縮包;
當所述排序后的語音壓縮包標識不符合所述指定規則時,確定所述音頻信息丟失語音壓縮包。
可選地,所述當所述音頻信息中丟失語音壓縮包時,基于與所述丟失的語音壓縮包相鄰的至少一個語音壓縮包的發音信息,在丟失語音壓縮包的位置處添加語音補償信息,得到優化音頻信息,包括:
將所述語音壓縮包標識中不符合所述指定規則的相鄰兩個語音壓縮包標識之間的位置,確定為所述音頻信息中丟失語音壓縮包的位置;
在對所述音頻信息進行解壓后,確定與所述丟失的語音壓縮包前后相鄰的兩個語音壓縮包分別對應的第一發音信息和第二發音信息;
基于所述第一發音信息和所述第二發音信息中的至少一個發音信息,在丟失語音壓縮包的位置處添加所述語音補償信息,得到所述優化音頻信息,所述語音補償信息能夠與所述第一發音信息和所述第二發音信息中的至少一個發音信息實現平滑過渡。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于海信集團有限公司,未經海信集團有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710102948.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種適用于膽甾相液晶顯示裝置的掃描驅動方法
- 下一篇:環繞式直播立體聲方法





