[發明專利]語音搜索結果的處理方法和處理裝置在審

申請號：	201710822725.2	申請日：	2017-09-13
公開（公告）號：	CN107610706A	公開（公告）日：	2018-01-19
發明（設計）人：	蔣兵;馬嘯空	申請（專利權）人：	百度在線網絡技術（北京）有限公司
主分類號：	G10L17/00	分類號：	G10L17/00;G10L17/02;G10L17/04;G10L21/02;G10L25/24;G10L25/84
代理公司：	北京英賽嘉華知識產權代理有限責任公司11204	代理人：	王達佐,馬曉亞
地址：	100085 北京市***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	語音搜索結果處理方法裝置
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種語音搜索結果的處理方法，其特征在于，所述方法包括：

接收用戶輸入的語音信息，并提取所述語音信息的聲學特征；

基于所述聲學特征，提取所述語音信息的辨識矢量i-vector特征；

將所述i-vector特征在預先訓練的判別模型中進行識別，其中，所述判別模型用于識別所述語音信息所對應的用戶的身份信息；

基于所述判別模型的識別結果，對獲取到的與所述語音信息相關的搜索結果進行處理。

2.根據權利要求1所述的方法，其特征在于，所述聲學特征包括梅爾頻率倒譜系數特征，以及

所述基于所述聲學特征，提取所述語音信息的辨識矢量i-vector特征，包括：

對于提取到的梅爾頻率倒譜系數特征中的每一特征分量，計算該特征分量在預先構建的高斯混合模型中的后驗概率，并獲取該特征分量在所述高斯混合模型中的各階統計量；

根據所述梅爾頻率倒譜系數特征的各特征分量的各階統計量，提取所述語音信息的i-vector特征。

3.根據權利要求2所述的方法，其特征在于，所述根據所述梅爾頻率倒譜系數特征的各特征分量的各階統計量，提取所述語音信息的i-vector特征，包括：

響應于檢測到結束語音輸入的操作，則根據所述梅爾頻率倒譜系數特征的各特征分量的各階統計量，提取所述語音信息的i-vector特征。

4.根據權利要求1所述的方法，其特征在于，所述身份信息包括用于指示用戶是否為兒童的信息，以及所述方法還包括訓練判別模型的步驟，包括：

獲取不同年齡階段兒童的樣本語音；

對于每個年齡階段兒童的樣本語音，提取該樣本語音的i-vector特征，利用機器學習法，將該樣本語音的i-vector特征作為輸入，將用于指示該樣本語音所對應的用戶為兒童的身份信息作為輸出，訓練得到該年齡階段的童聲模型；

利用線性回歸學習法，基于不同年齡階段的童聲模型，生成判別模型。

5.根據權利要求4所述的方法，其特征在于，所述基于所述判別模型的識別結果，對獲取到的與所述語音信息相關的搜索結果進行處理，包括：

若所述判別模型識別出所述語音信息所對應的用戶的身份為兒童，則對獲取到的與所述語音信息相關的搜索結果的內容進行過濾處理，并將處理后的搜索結果發送給所述用戶。

6.根據權利要求1所述的方法，其特征在于，所述接收用戶輸入的語音信息，并提取所述語音信息的聲學特征，包括：

接收用戶輸入的語音信息，并對所述語音信息進行語音活動檢測，生成有效的語音信息；

提取所述有效的語音信息的聲學特征。

7.根據權利要求1-6之一所述的方法，其特征在于，所述方法還包括：

自檢測到啟動語音輸入的操作開始，確定所述用戶當前輸入的語音信息的時長是否大于預設時長；

若確定當前輸入的語音信息的時長大于預設時長，則向所述用戶發送提示信息。

8.一種語音搜索結果的處理裝置，其特征在于，所述裝置包括：

接收單元，配置用于接收用戶輸入的語音信息，并提取所述語音信息的聲學特征；

提取單元，配置用于基于所述聲學特征，提取所述語音信息的辨識矢量i-vector特征；

識別單元，配置用于將所述i-vector特征在預先訓練的判別模型中進行識別，其中，所述判別模型用于識別所述語音信息所對應的用戶的身份信息；

處理單元，配置用于基于所述判別模型的識別結果，對獲取到的與所述語音信息相關的搜索結果進行處理。

9.根據權利要求8所述的裝置，其特征在于，所述身份信息包括用于指示用戶是否為兒童的信息，以及所述裝置還包括訓練單元，配置用于：

獲取不同年齡階段兒童的樣本語音；

利用線性回歸學習法，基于不同年齡階段的童聲模型，生成判別模型。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術（北京）有限公司，未經百度在線網絡技術（北京）有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201710822725.2/1.html，轉載請聲明來源鉆瓜專利網。

同類專利

專利分類

G 物理

G10 樂器；聲學
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L17-00 講話者辨認或驗證

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】