[發明專利]基于分形特征的智能輪椅語音識別控制方法及系統無效
| 申請號: | 201110109168.2 | 申請日: | 2011-04-28 |
| 公開(公告)號: | CN102184732A | 公開(公告)日: | 2011-09-14 |
| 發明(設計)人: | 張毅;羅元;李敏;蔡軍;謝穎;林海波;黃璜;李艷花 | 申請(專利權)人: | 重慶郵電大學 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/04 |
| 代理公司: | 北京同恒源知識產權代理有限公司 11275 | 代理人: | 趙榮之 |
| 地址: | 400065*** | 國省代碼: | 重慶;85 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 特征 智能 輪椅 語音 識別 控制 方法 系統 | ||
技術領域
本發明涉及計算機語音識別控制領域,具體涉及一種基于分形特征的語音識別智能輪椅控制方法。
背景技術
隨著社會的發展和人類文明程度的提高,人們特別是老年人、殘疾人的服務需求會日益增加,他們愈來愈需要運用現代高新技術來改善他們的生活質量和生活自由度。無論是國際上還是我國國內,人口老齡化的進程正在加快,另外由于各種交通事故、天災人禍和種種疾病,每年均有成千上萬的人喪失一種或多種能力(如行走、動手能力等),這種社會現實促進了智能化服務機器人在助老、助殘方面的應用。因此,智能輪椅作為助老、助殘服務機器人系列產品中的一個重要研究領域已逐漸成為國內外科技人員研究的熱點。輪椅作為廣大老弱病殘人員使用的輔助運動工具,幾乎都是室外使用的手柄控制的電動輪椅,對于那些四肢活動能力受限的老年人或殘疾者控制起來不是十分方便,因此,我們將語音控制應用于智能輪椅上,形成一種將智能輪椅與語音識別技術結合起來的新型代步工具,它不僅具有普通輪椅的所有功能,重要的是還可以通過語音命令對輪椅進行控制,使輪椅的控制更加簡單、方便,宜人性更好。因此,實用的語音控制智能輪椅機器人將為老年人和殘疾人開創新的生活模式和生活概念,具有非常重要的現實意義。
在國內外,研究者們已經開展了大量相關項目的研究:1996年西班牙由ONCE基金會資助的SIAMO項目,目標是根據用戶的殘障程度及特殊需求建造多功能系統,為了達到要求,特別研究了系統的模塊化和靈活性,設計了分布式構架,也著重開發了人機界面,其中也把語音識別控制技術應用于智能輪椅,使用戶更易于控制輪椅。日本北海道工業設計學院的研究人員研制出一種不用人工操作的聲控輪椅。研究人員將可感應語言聲響的晶片,裝置在輪椅的控制機關內,在使用者對著麥克風講出要求后,感應系統便會依照要求啟動運作,除了可向前后左右和快慢行走外,椅背還可向后傾,方便使用者休息。中國科學院自動化研究所承擔了“863”智能機器人智能輪椅項目,研制了一種具有視覺和口令導航功能并能與人進行語音交互的機器人輪椅NLPR,此項研究高度重視了智能輪椅人機控制界面的設計,在輪椅的設計中綜合運用模式識別實驗室有關圖像處理、計算機視覺和語音識別等最新成果,使人能通過語音控制輪椅自由行走,輪椅可以實現簡單的人機對話功能。上海交通大學開發成功一種聲控輪椅,主要是為四肢全部喪失功能的殘疾者設計,使用者只需發出“開”、“前”、“后”、“左”、“右”、“快”、“慢”、“停”等指令,輪椅可在1.2秒內按指令執行。但是,由于語音信號是一個復雜的非線性過程,那么基于傳統的線性系統理論發展起來的語音識別技術的性能就難以進一步的提高。
因此急需一種采用高識別率的語音識別系統來控制智能輪椅的方法。
發明內容
有鑒于此,為了解決上述問題,本發明提出一種采用高識別率的語音識別系統來控制智能輪椅的方法。是一種基于非線性理論的特征提取方法,即將語音信號的分形特征參數合并到傳統的Mel頻率倒譜系數(MFCC)中,這樣組成混合的特征參數在語音識別系統中可以提高系統的識別率。
本發明的目的之一是提出一種基于分形特征的智能輪椅語音識別控制方法方法;本發明的目的之二是提出一種基于分形特征的智能輪椅語音識別控制系統。
本發明的目的之一是通過以下技術方案來實現的:
本發明提供的基于分形特征的智能輪椅語音識別控制方法,包括以下步驟:
S1:語音信號命令詞輸入;
S2:對語音信號進行預處理;
S3:提取經過預處理后語音信號的特征參數;
S4:將特征參數與模板庫的模板進行模式匹配;
S5:選擇匹配相似度最高的模板作為識別結果;
S6:將該識別結果轉換成智能輪椅的運動命令;
S7:調用相應的控制函數,驅動智能輪椅按照語音信號進行運動。
進一步,所述步驟S2中的預處理,包括語音的預加重濾波、加窗分幀處理與雙門限端點檢測;
進一步,所述步驟S3中的特征提取包括以下步驟:
S31:提取語音信號的MFCC(Mel頻率倒譜系數)參數;
S311:首先確定每一幀語音采樣序列的點數,對每幀序列s(n)進行預加重濾波處理;
S312:再進行離散FFT(傅立葉變換)變換,取模的平方得到離散功率譜S(n);
S313:在語音的頻譜范圍內設置若干個帶通濾波器;
Hm(n),m=0,1,·,M-1,n=0,1,·,N/2-1
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶郵電大學,未經重慶郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110109168.2/2.html,轉載請聲明來源鉆瓜專利網。





