[發明專利]一種機器人語音識別定位方法及系統在審

申請號：	202111361624.2	申請日：	2021-11-17
公開（公告）號：	CN114236469A	公開（公告）日：	2022-03-25
發明（設計）人：	張九華;陳興元;羅國平	申請（專利權）人：	樂山師范學院
主分類號：	G01S5/18	分類號：	G01S5/18;B25J13/00
代理公司：	成都拓荒者知識產權代理有限公司 51254	代理人：	聶臣欣
地址：	614000 四***	國省代碼：	四川;51
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種機器人語音識別定位方法系統
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本發明公開了一種機器人語音識別定位方法，包括S1、構建麥克風陣列模型；S2、采集麥克風陣元的語音信號，并進行預處理；S3、對預處理后的語音信號進行匹配識別；S4、分別計算麥克風陣元之間匹配的語音信號的相對時延；S5、根據計算的相對時延對機器人位姿進行估計。本發明能過實現實時獲取環境中的語音信號并通過聲源定位準確確定出機器人的準確位置，在保證定位精度的同時，能夠加快機器人定位算法的計算效率。

技術領域

本發明涉及機器人自我感知和定位技術領域，具體涉及一種機器人語音識別定位方法及系統。

背景技術

在日常生活中，人們之間的交互方式主要包括語音、視覺、手勢等形式，其中語音是最為簡單高效的一種交互形式，也最符合人們的交流習慣。語音識別技術是近幾年的研究熱點，已取得較大進展，并在很多領域得到了應用，比如車載設備、游戲、智能家電等。語音識別技術能夠讓機器理解用戶所說的內容，解放了用戶雙手，提升人機交互體驗。

針對應用場合的不同，語音識別的側重點也不盡相同。有些情況僅僅需要識別其中的一些關鍵詞即可，比如基于語音關鍵詞的運動控制；有一些場景要求盡量準確的識別出語音包含的所有漢字，比如語音輸入；還有些情況不僅要求完整識別文字，還要求能夠洞察出說話人的情感信息。要想使用戶有好的人機交互體驗，除了語音識別技術外，同樣也離不開聲源定位技術，只有讓機器知曉說話人的方位，才能夠有針對性的做出動作響應，而且將定位信息進一步同視覺等信息結合，可以開發出更多的功能場景。雖然語音技術已經在很多領域都已經有廣泛應用，但是在機器人行業中還沒有完全普及，也存在一些技術問題有待解決。

發明內容

針對現有技術中的上述不足，本發明提供了一種機器人語音識別定位方法及系統。

為了達到上述發明目的，本發明采用的技術方案為：

第一方面，本發明提供了一種機器人語音識別定位方法，包括以下步驟：

S1、構建麥克風陣列模型；

S2、采集麥克風陣元的語音信號，并進行預處理；

S3、對預處理后的語音信號進行匹配識別；

S4、分別計算麥克風陣元之間匹配的語音信號的相對時延；

S5、根據計算的相對時延對機器人位姿進行估計。

進一步地，所述步驟S1具體包括：

在世界坐標系中采用四個麥克風組成四元十字形麥克風陣列，上述四元十字形麥克風陣列的中心位于世界坐標系原點，每個麥克風均位于坐標軸上，且距離世界坐標系原點的距離相等。

進一步地，所述步驟S2具體包括以下分步驟：