[發(fā)明專利]基于語(yǔ)音自動(dòng)識(shí)別的對(duì)講機(jī)實(shí)現(xiàn)系統(tǒng)及方法有效
| 申請(qǐng)?zhí)枺?/td> | 201910034671.2 | 申請(qǐng)日: | 2019-01-15 |
| 公開(kāi)(公告)號(hào): | CN109859748B | 公開(kāi)(公告)日: | 2021-06-04 |
| 發(fā)明(設(shè)計(jì))人: | 陳杰;林兆劍;陳春強(qiáng);詹麗華;林靜 | 申請(qǐng)(專利權(quán))人: | 福建天眼視訊網(wǎng)絡(luò)科技有限公司 |
| 主分類號(hào): | G10L15/16 | 分類號(hào): | G10L15/16;G10L15/30;G10L15/22 |
| 代理公司: | 福州市鼓樓區(qū)京華專利事務(wù)所(普通合伙) 35212 | 代理人: | 王美花 |
| 地址: | 350108 福建省福州市閩侯縣上街鎮(zhèn)科技東路*** | 國(guó)省代碼: | 福建;35 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 語(yǔ)音 自動(dòng)識(shí)別 對(duì)講機(jī) 實(shí)現(xiàn) 系統(tǒng) 方法 | ||
本發(fā)明提供一種基于語(yǔ)音自動(dòng)識(shí)別的對(duì)講機(jī)實(shí)現(xiàn)系統(tǒng),包括語(yǔ)音采集模塊,用于采集聲音信號(hào),將聲音信號(hào)轉(zhuǎn)換成模擬電信號(hào);音頻編解碼模塊,用于將模擬電信號(hào)轉(zhuǎn)換成數(shù)字音頻信號(hào);語(yǔ)音識(shí)別模塊,用于通過(guò)基于語(yǔ)音深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)模型,對(duì)數(shù)字音頻信號(hào)進(jìn)行識(shí)別,并獲得識(shí)別結(jié)果;主控制模塊,用于控制將識(shí)別結(jié)果上傳給遠(yuǎn)程服務(wù)器,由遠(yuǎn)程服務(wù)器根據(jù)識(shí)別結(jié)果執(zhí)行對(duì)應(yīng)的操作。本發(fā)明還提供一種系統(tǒng)所對(duì)應(yīng)的方法。本發(fā)明優(yōu)點(diǎn)在于:實(shí)現(xiàn)對(duì)講機(jī)的智能化控制,而不需要通過(guò)人工手動(dòng)去控制或者操控對(duì)講機(jī),可為對(duì)講機(jī)的實(shí)際使用帶來(lái)極大的方便。
技術(shù)領(lǐng)域
本發(fā)明涉及對(duì)講機(jī)領(lǐng)域,特別涉及基于語(yǔ)音自動(dòng)識(shí)別的對(duì)講機(jī)實(shí)現(xiàn)系統(tǒng)及方法。
背景技術(shù)
對(duì)講機(jī)的英文名稱是two way radio,它是一種雙向移動(dòng)通信工具,在不需要任何網(wǎng)絡(luò)支持的情況下,就可以通話,沒(méi)有話費(fèi)產(chǎn)生,適用于相對(duì)固定且頻繁通話的場(chǎng)合。對(duì)講機(jī)目前有三大類:模擬對(duì)講機(jī)、數(shù)字對(duì)講機(jī)、IP對(duì)講機(jī)。
傳統(tǒng)的對(duì)講機(jī)都是通過(guò)廣播的方式,來(lái)將一定范圍內(nèi)的處于同一頻段的對(duì)講機(jī)建立分組,或者通過(guò)加密碼的方式建立分組。對(duì)于公網(wǎng)對(duì)講機(jī),是通過(guò)對(duì)講服務(wù)器來(lái)將指定的對(duì)講設(shè)備分組,分組內(nèi)的對(duì)講設(shè)備可以進(jìn)行對(duì)講,所有的控制都是由對(duì)講服務(wù)器來(lái)完成。
但是,現(xiàn)有技術(shù)在實(shí)現(xiàn)對(duì)對(duì)講機(jī)的管理時(shí),存在有如下缺陷:只能人工手動(dòng)控制對(duì)講機(jī)、人工手動(dòng)進(jìn)行分組管理等,而無(wú)法實(shí)現(xiàn)對(duì)講機(jī)的智能控制;而通過(guò)遠(yuǎn)程平臺(tái)來(lái)創(chuàng)建或者調(diào)整分組,則無(wú)法實(shí)現(xiàn)開(kāi)機(jī)即用;同時(shí),在操作對(duì)講機(jī)(如調(diào)節(jié)音量等)時(shí),需要人工手動(dòng)進(jìn)行調(diào)節(jié),而此時(shí)如果操作人正在執(zhí)行其它操作(例如在開(kāi)車),將會(huì)帶來(lái)不便。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問(wèn)題之一,在于提供一種基于語(yǔ)音自動(dòng)識(shí)別的對(duì)講機(jī)實(shí)現(xiàn)系統(tǒng),通過(guò)該系統(tǒng)可實(shí)現(xiàn)對(duì)講機(jī)的智能化控制,而不需要通過(guò)人工手動(dòng)去控制或者操控對(duì)講機(jī),可為對(duì)講機(jī)的實(shí)際使用帶來(lái)極大的方便。
本發(fā)明是這樣實(shí)現(xiàn)技術(shù)問(wèn)題之一的:基于語(yǔ)音自動(dòng)識(shí)別的對(duì)講機(jī)實(shí)現(xiàn)系統(tǒng),所述系統(tǒng)包括語(yǔ)音采集模塊、音頻編解碼模塊、語(yǔ)音識(shí)別模塊以及主控制模塊:
所述語(yǔ)音采集模塊,用于采集聲音信號(hào),將聲音信號(hào)轉(zhuǎn)換成模擬電信號(hào);
所述音頻編解碼模塊,用于將模擬電信號(hào)轉(zhuǎn)換成數(shù)字音頻信號(hào);
所述語(yǔ)音識(shí)別模塊,用于通過(guò)基于語(yǔ)音深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)模型,對(duì)數(shù)字音頻信號(hào)進(jìn)行識(shí)別,并獲得識(shí)別結(jié)果;
所述主控制模塊,用于控制將識(shí)別結(jié)果上傳給遠(yuǎn)程服務(wù)器,由遠(yuǎn)程服務(wù)器根據(jù)識(shí)別結(jié)果執(zhí)行對(duì)應(yīng)的操作。
進(jìn)一步地,所述系統(tǒng)還包括語(yǔ)音播放模塊;
所述主控制模塊,還用于接收遠(yuǎn)程服務(wù)器下發(fā)的語(yǔ)音消息或者反饋的語(yǔ)音指令;
所述語(yǔ)音識(shí)別模塊,還用于將遠(yuǎn)程服務(wù)器下發(fā)的語(yǔ)音消息或者反饋的語(yǔ)音指令轉(zhuǎn)換成數(shù)字語(yǔ)音;
所述音頻編解碼模塊,還用于將數(shù)字語(yǔ)音轉(zhuǎn)換成模擬語(yǔ)音;
所述語(yǔ)音播放模塊,用于播放模擬語(yǔ)音。
進(jìn)一步地,所述語(yǔ)音識(shí)別模塊具體包括模型學(xué)習(xí)單元以及語(yǔ)音識(shí)別單元:
所述模型學(xué)習(xí)單元,用于預(yù)先錄制并保存各個(gè)語(yǔ)音命令的語(yǔ)音片段,采用神經(jīng)網(wǎng)絡(luò)識(shí)別所述語(yǔ)音片段,進(jìn)行深度學(xué)習(xí)訓(xùn)練所述神經(jīng)網(wǎng)絡(luò),從而獲得基于語(yǔ)音深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)模型;
所述語(yǔ)音識(shí)別單元,用于使用基于語(yǔ)音深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)模型來(lái)對(duì)上傳的數(shù)字音頻信號(hào)進(jìn)行語(yǔ)音比較,且如果該數(shù)字音頻信號(hào)與神經(jīng)網(wǎng)絡(luò)模型中學(xué)習(xí)過(guò)的某一語(yǔ)音命令的相似度超過(guò)設(shè)定的相似閾值,則將該數(shù)字音頻信號(hào)識(shí)別成對(duì)應(yīng)的語(yǔ)音命令;否則就將該數(shù)字音頻信號(hào)識(shí)別為語(yǔ)音消息;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于福建天眼視訊網(wǎng)絡(luò)科技有限公司,未經(jīng)福建天眼視訊網(wǎng)絡(luò)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910034671.2/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 用于語(yǔ)音處理的方法與系統(tǒng)
- 一種語(yǔ)音識(shí)別測(cè)試系統(tǒng)及方法
- 用于語(yǔ)音識(shí)別的方法和裝置
- 一種語(yǔ)音消毒柜的控制方法及語(yǔ)音消毒柜
- 一種語(yǔ)音處理方法及裝置
- 混合語(yǔ)音識(shí)別方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 語(yǔ)音情緒識(shí)別方法、系統(tǒng)、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 一種具有語(yǔ)音識(shí)別功能的智能語(yǔ)音終端設(shè)備
- 語(yǔ)音增強(qiáng)方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種聲紋鑒定語(yǔ)音重組方法和系統(tǒng)
- 在帶有圖像輸入單元的便攜式終端中識(shí)別字符的方法
- 基于無(wú)線射頻RFID的檔案管理系統(tǒng)
- 一種防盜監(jiān)控系統(tǒng)的自動(dòng)識(shí)別控制設(shè)備
- 一種基于視頻識(shí)別的隧道運(yùn)行安全事件檢測(cè)系統(tǒng)
- 存儲(chǔ)擴(kuò)充裝置自動(dòng)識(shí)別系統(tǒng)及存儲(chǔ)擴(kuò)充裝置自動(dòng)識(shí)別配置方法
- 快遞物流件自動(dòng)識(shí)別分揀系統(tǒng)
- 一種基于無(wú)線技術(shù)的低功耗自動(dòng)識(shí)別終端設(shè)計(jì)方法
- 一種火車車輛、車號(hào)自動(dòng)識(shí)別裝置
- 一種火車車輛、車號(hào)自動(dòng)識(shí)別裝置及其使用方法
- 一種電商用條碼自動(dòng)識(shí)別裝置





