[發(fā)明專利]無人機械控制方法、電臺語音指令轉(zhuǎn)換方法及裝置有效
| 申請?zhí)枺?/td> | 202110537721.6 | 申請日: | 2021-05-18 |
| 公開(公告)號: | CN113270097B | 公開(公告)日: | 2022-05-17 |
| 發(fā)明(設(shè)計)人: | 陳英爽;鮑捷;呂春 | 申請(專利權(quán))人: | 成都傅立葉電子科技有限公司;深圳市特發(fā)信息股份有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/16;G10L21/0208 |
| 代理公司: | 成都誠中致達專利代理有限公司 51280 | 代理人: | 曹宇杰 |
| 地址: | 610041 四川省成都*** | 國省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 無人 機械 控制 方法 電臺 語音 指令 轉(zhuǎn)換 裝置 | ||
一種無人機械控制方法、電臺語音指令轉(zhuǎn)換方法及裝置,控制方法包括:通過遠場的無線發(fā)射電臺將麥克風或?qū)χv機采集的電臺語音指令信息發(fā)送,對接收的電臺語音指令進行去噪增強處理,獲得增益語音指令頻譜;對增益語音指令頻譜進行語音信道轉(zhuǎn)換,獲得到非電臺語音指令;對非電臺語音指令進行語音識別,獲得文字控制指令;文字控制指令,用于控制無人機械。實現(xiàn)利用遠場無線電臺傳輸?shù)碾娕_語音指令,通過接收、去噪增強、信道轉(zhuǎn)換、識別獲得可以用于控制無人機械的文字控制指令,以方便對無人機械的控制,使用方便,直接通過語音控制、交互性更強。
技術(shù)領(lǐng)域
本發(fā)明涉及無人機械控制與語音轉(zhuǎn)換識別技術(shù)領(lǐng)域,尤其涉及一種無人機械控制方法、電臺語音指令轉(zhuǎn)換方法及裝置。
背景技術(shù)
隨著科技進步及智能技術(shù)的發(fā)展,各類無人機械越來越多的被開發(fā)出來應用到各領(lǐng)域,比如無人機、無人車、無人船等。目前對于無人機械的控制主要有三種方式:
方式1:采用手柄控制,這種方式只能做一些簡單的控制,例如:上下前后左右控制,而無法使用復雜指令進行控制、也無法實現(xiàn)一對多控制;
方式2:通過鍵盤輸入指令控制,這種方式攜帶和使用均不方便,且在使用手柄控制時候無法使用鍵盤控制;
方式3:通過可視化界面控制、把所有功能做成管理軟件,但是開發(fā)成本大、使用的學習成本大,且使用手柄控制時候無法使用可視化界面控制。
上述這些方式均不能靈活方便的對無人機械進行控制。
發(fā)明內(nèi)容
針對上述現(xiàn)有技術(shù)不足,本申請?zhí)峁┮环N無人機械控制方法、電臺語音指令轉(zhuǎn)換方法及裝置,應用于無人機械,實現(xiàn)利用遠場無線電臺傳輸?shù)碾娕_語音指令,通過接收、去噪增強、信道轉(zhuǎn)換、識別獲得可以用于控制無人機械的文字控制指令,以方便對無人機械的控制,使用方便,直接通過語音控制、交互性更強。
為了實現(xiàn)本發(fā)明的目的,擬采用以下方案:
一種電臺語音指令轉(zhuǎn)換方法,應用于無人機械,包括:
對接收的由遠場無線電臺發(fā)送的電臺語音指令進行去噪增強處理,獲得增益語音指令頻譜;
對增益語音指令頻譜進行語音信道轉(zhuǎn)換,獲得到非電臺語音指令;
對非電臺語音指令進行語音識別,獲得文字控制指令;文字控制指令,用于控制無人機械。
進一步,由遠場無線電臺發(fā)送的電臺語音指令,是在遠場處通過麥克風或?qū)χv機采集的、并由遠場無線電臺發(fā)送的電臺語音指令。
進一步,去噪增強處理,包括:
將接收的由遠場無線電臺發(fā)送的電臺語音指令按預設(shè)時間間隔長度分隔成N個小塊;N為整數(shù),等于電臺語音指令的時長÷預設(shè)時間間隔長度;
對小塊分別進行短時傅里葉變換處理,獲得N個第一頻譜;
將N個第一頻譜分別輸入語音去噪增強網(wǎng)絡(luò)中進行處理,獲得N個去噪增強頻譜;
將N個去噪增強頻譜組合成一個完整的增益語音指令頻譜。
進一步,語音去噪增強網(wǎng)絡(luò),包括7層CNN網(wǎng)絡(luò)、1層LSTM網(wǎng)絡(luò)、2層DNN網(wǎng)絡(luò);
第一頻譜具有第一預設(shè)頻譜寬度;
通過語音去噪增強網(wǎng)絡(luò)對每個第一頻譜進行處理的步驟包括:
通過7層CNN網(wǎng)絡(luò)對一個第一頻譜進行去噪增強處理,獲得多個具有第一預設(shè)頻譜寬度的第二頻譜;
通過1層LSTM網(wǎng)絡(luò)對多個第二頻譜進行去噪增強處理,獲得一個具有第二預設(shè)頻譜寬度的第三頻譜;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于成都傅立葉電子科技有限公司;深圳市特發(fā)信息股份有限公司,未經(jīng)成都傅立葉電子科技有限公司;深圳市特發(fā)信息股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110537721.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





