[發明專利]一種基于語音屬性分類的交互系統及其方法有效
| 申請號: | 201610244968.8 | 申請日: | 2016-04-19 |
| 公開(公告)號: | CN105761720B | 公開(公告)日: | 2020-01-07 |
| 發明(設計)人: | 潘復平 | 申請(專利權)人: | 北京地平線機器人技術研發有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/02;G10L15/06;G10L15/08;G10L25/30;G10L25/63;G10L25/66 |
| 代理公司: | 11497 北京市正見永申律師事務所 | 代理人: | 黃小臨;王懷章 |
| 地址: | 100085 北京市海淀區上地信息路1號(北京實創高*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 語音 屬性 分類 交互 系統 及其 方法 | ||
本申請公開了一種基于語音屬性分類的交互系統及其方法。所述系統包括:聲學特征提取單元,配置用于提取輸入的語音信號的聲學特征,生成第一信號;語音屬性分類單元,配置用于第一信號經屬性識別分類器確定其語音屬性值,輸出語音屬性結果,生成第二信號;交互決策單元,配置用于基于第二信號輸出反饋信息。語音屬性分類單元同時檢測多種語音屬性,根據各語音屬性值輸出相應的反饋信息,使交互流程豐富多彩。
技術領域
本公開一般涉及交互領域,具體涉及人機交互技術,尤其涉及基于語音屬性的交互系統。
背景技術
常規的人機語音交互過程表現為機器識別人發出的語音指令,然后根據識別結果,做出相應的反應。這種交互包含的內容僅限于語音指令的字面含義,形式單一,用戶體驗枯燥,不適用于玩具、家居等需要形式活潑多樣的交互場景。
目前,在人機交互中,常采用聲紋注冊技術判斷用戶身份,實現人性化的交互。聲紋注冊過程中,先用聲紋識別技術把用戶的語音進行注冊,把用戶身份與聲紋相關聯,然后在使用過程中,先識別說話人的聲紋,然后根據聲紋判斷說話人的身份,再根據用戶身份進行一些有限的交互變化。比如一些智能玩具可以根據聲音判斷當前說話人是爸爸、媽媽還是寶寶,根據身份的不同,可以改變對說話人的稱謂。
現有技術的缺點在于,一方面,傳統技術往往只能檢測一種語音屬性,根據語音屬性的不同,交互內容發生的變化也十分有限;另一方面,聲紋注冊技術使用起來十分繁瑣且不靈活。
發明內容
鑒于現有技術中的上述缺陷或不足,期望提供一種基于語音屬性分類的交互系統及其方法。
第一方面,提出一種基于語音屬性分類的交互系統,該系統包括:
聲學特征提取單元,配置用于提取輸入的語音信號的聲學特征,生成第一信號;
語音屬性分類單元,配置用于第一信號經屬性識別分類器確定其語音屬性值,輸出語音屬性結果,生成第二信號;
交互決策單元,配置用于基于第二信號輸出反饋信息。
第二方面提供一種基于語音屬性分類的交互方法,該方法包括:
提取輸入的語音信號的聲學特征,生成第一信號;
第一信號經屬性識別分類確定其語音屬性值,輸出語音屬性結果,生成第二信號;
基于第二信號輸出反饋信息。
根據本申請實施例提供的技術方案,語音屬性分類單元可以同時檢測語音的多種語音屬性,并根據各語音屬性值輸出相應的反饋信息,使交互流程豐富多彩;另外,本發明通過語音屬性分類,能夠自動判斷說話人的身份,所以不需要注冊過程,使用簡單方便,自由靈活。
附圖說明
通過閱讀參照以下附圖所作的對非限制性實施例所作的詳細描述,本申請的其它特征、目的和優點將會變得更明顯:
圖1為根據實施例的一種基于語音屬性分類的交互系統的結構圖。
圖2為一種基于語音屬性分類的交互方法的流程圖。
具體實施方式
下面結合附圖和實施例對本申請作進一步的詳細說明。可以理解的是,此處所描述的具體實施例僅僅用于解釋相關發明,而非對該發明的限定。另外還需要說明的是,為了便于描述,附圖中僅示出了與發明相關的部分。
需要說明的是,在不沖突的情況下,本申請中的實施例及實施例中的特征可以相互組合。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京地平線機器人技術研發有限公司,未經北京地平線機器人技術研發有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610244968.8/2.html,轉載請聲明來源鉆瓜專利網。





