[發明專利]一種機器人語音識別定位方法及系統在審
| 申請號: | 202111361624.2 | 申請日: | 2021-11-17 |
| 公開(公告)號: | CN114236469A | 公開(公告)日: | 2022-03-25 |
| 發明(設計)人: | 張九華;陳興元;羅國平 | 申請(專利權)人: | 樂山師范學院 |
| 主分類號: | G01S5/18 | 分類號: | G01S5/18;B25J13/00 |
| 代理公司: | 成都拓荒者知識產權代理有限公司 51254 | 代理人: | 聶臣欣 |
| 地址: | 614000 四*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 機器人 語音 識別 定位 方法 系統 | ||
本發明公開了一種機器人語音識別定位方法,包括S1、構建麥克風陣列模型;S2、采集麥克風陣元的語音信號,并進行預處理;S3、對預處理后的語音信號進行匹配識別;S4、分別計算麥克風陣元之間匹配的語音信號的相對時延;S5、根據計算的相對時延對機器人位姿進行估計。本發明能過實現實時獲取環境中的語音信號并通過聲源定位準確確定出機器人的準確位置,在保證定位精度的同時,能夠加快機器人定位算法的計算效率。
技術領域
本發明涉及機器人自我感知和定位技術領域,具體涉及一種機器人語音識別定位方法及系統。
背景技術
在日常生活中,人們之間的交互方式主要包括語音、視覺、手勢等形式,其中語音是最為簡單高效的一種交互形式,也最符合人們的交流習慣。語音識別技術是近幾年的研究熱點,已取得較大進展,并在很多領域得到了應用,比如車載設備、游戲、智能家電等。語音識別技術能夠讓機器理解用戶所說的內容,解放了用戶雙手,提升人機交互體驗。
針對應用場合的不同,語音識別的側重點也不盡相同。有些情況僅僅需要識別其中的一些關鍵詞即可,比如基于語音關鍵詞的運動控制;有一些場景要求盡量準確的識別出語音包含的所有漢字,比如語音輸入;還有些情況不僅要求完整識別文字,還要求能夠洞察出說話人的情感信息。要想使用戶有好的人機交互體驗,除了語音識別技術外,同樣也離不開聲源定位技術,只有讓機器知曉說話人的方位,才能夠有針對性的做出動作響應,而且將定位信息進一步同視覺等信息結合,可以開發出更多的功能場景。雖然語音技術已經在很多領域都已經有廣泛應用,但是在機器人行業中還沒有完全普及,也存在一些技術問題有待解決。
發明內容
針對現有技術中的上述不足,本發明提供了一種機器人語音識別定位方法及系統。
為了達到上述發明目的,本發明采用的技術方案為:
第一方面,本發明提供了一種機器人語音識別定位方法,包括以下步驟:
S1、構建麥克風陣列模型;
S2、采集麥克風陣元的語音信號,并進行預處理;
S3、對預處理后的語音信號進行匹配識別;
S4、分別計算麥克風陣元之間匹配的語音信號的相對時延;
S5、根據計算的相對時延對機器人位姿進行估計。
進一步地,所述步驟S1具體包括:
在世界坐標系中采用四個麥克風組成四元十字形麥克風陣列,上述四元十字形麥克風陣列的中心位于世界坐標系原點,每個麥克風均位于坐標軸上,且距離世界坐標系原點的距離相等。
進一步地,所述步驟S2具體包括以下分步驟:
S2-1、采集麥克風陣元的語音信號;
S2-2、采用設定采樣頻率對采集的語音信號進行采樣;
S2-3、對采樣的語音信號進行高頻提升處理;
S2-4、對處理后的語音信號進行分幀處理;
S2-5、對處理后的語音信號進行加窗處理;
S2-6、采用短時能量和短時平均過零率方法對處理后的語音信號進行端點檢測。
進一步地,所述步驟S3具體包括以下分步驟:
S3-1、對預處理后的語音信號分別提取線性預測系數特征和頻率倒譜系數特征,并建立語音識別特征矢量序列;
S3-2、計算每一個語音識別特征矢量序列與已知語音識別特征矢量序列的幀匹配距離矩陣;
S3-3、在幀匹配距離矩陣中遞歸搜索匹配距離最小的語音信號作為識別結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于樂山師范學院,未經樂山師范學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111361624.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種箱體卡裝結構
- 下一篇:基于非客戶端模式被動檢查離線非法外聯方法和裝置





