[發明專利]一種基于語音屬性分類的交互系統及其方法有效

申請號：	201610244968.8	申請日：	2016-04-19
公開（公告）號：	CN105761720B	公開（公告）日：	2020-01-07
發明（設計）人：	潘復平	申請（專利權）人：	北京地平線機器人技術研發有限公司
主分類號：	G10L15/22	分類號：	G10L15/22;G10L15/02;G10L15/06;G10L15/08;G10L25/30;G10L25/63;G10L25/66
代理公司：	11497 北京市正見永申律師事務所	代理人：	黃小臨;王懷章
地址：	100085 北京市海淀區上地信息路1號(北京實創高***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種基于語音屬性分類交互系統及其方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本申請公開了一種基于語音屬性分類的交互系統及其方法。所述系統包括：聲學特征提取單元，配置用于提取輸入的語音信號的聲學特征，生成第一信號；語音屬性分類單元，配置用于第一信號經屬性識別分類器確定其語音屬性值，輸出語音屬性結果，生成第二信號；交互決策單元，配置用于基于第二信號輸出反饋信息。語音屬性分類單元同時檢測多種語音屬性，根據各語音屬性值輸出相應的反饋信息，使交互流程豐富多彩。

技術領域

本公開一般涉及交互領域，具體涉及人機交互技術，尤其涉及基于語音屬性的交互系統。

背景技術

常規的人機語音交互過程表現為機器識別人發出的語音指令，然后根據識別結果，做出相應的反應。這種交互包含的內容僅限于語音指令的字面含義，形式單一，用戶體驗枯燥，不適用于玩具、家居等需要形式活潑多樣的交互場景。

目前，在人機交互中，常采用聲紋注冊技術判斷用戶身份，實現人性化的交互。聲紋注冊過程中，先用聲紋識別技術把用戶的語音進行注冊，把用戶身份與聲紋相關聯，然后在使用過程中，先識別說話人的聲紋，然后根據聲紋判斷說話人的身份，再根據用戶身份進行一些有限的交互變化。比如一些智能玩具可以根據聲音判斷當前說話人是爸爸、媽媽還是寶寶，根據身份的不同，可以改變對說話人的稱謂。

現有技術的缺點在于，一方面，傳統技術往往只能檢測一種語音屬性，根據語音屬性的不同，交互內容發生的變化也十分有限；另一方面，聲紋注冊技術使用起來十分繁瑣且不靈活。

發明內容

鑒于現有技術中的上述缺陷或不足，期望提供一種基于語音屬性分類的交互系統及其方法。

第一方面，提出一種基于語音屬性分類的交互系統，該系統包括：

聲學特征提取單元，配置用于提取輸入的語音信號的聲學特征，生成第一信號；

語音屬性分類單元，配置用于第一信號經屬性識別分類器確定其語音屬性值，輸出語音屬性結果，生成第二信號；

交互決策單元，配置用于基于第二信號輸出反饋信息。

第二方面提供一種基于語音屬性分類的交互方法，該方法包括：

提取輸入的語音信號的聲學特征，生成第一信號；

第一信號經屬性識別分類確定其語音屬性值，輸出語音屬性結果，生成第二信號；

基于第二信號輸出反饋信息。

根據本申請實施例提供的技術方案，語音屬性分類單元可以同時檢測語音的多種語音屬性，并根據各語音屬性值輸出相應的反饋信息，使交互流程豐富多彩；另外，本發明通過語音屬性分類，能夠自動判斷說話人的身份，所以不需要注冊過程，使用簡單方便，自由靈活。