[發(fā)明專利]語(yǔ)音交互方法及系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 201910476450.0 | 申請(qǐng)日: | 2019-06-03 |
| 公開(kāi)(公告)號(hào): | CN110288989A | 公開(kāi)(公告)日: | 2019-09-27 |
| 發(fā)明(設(shè)計(jì))人: | 張必超 | 申請(qǐng)(專利權(quán))人: | 安徽興博遠(yuǎn)實(shí)信息科技有限公司 |
| 主分類號(hào): | G10L15/22 | 分類號(hào): | G10L15/22;G10L15/25;G10L17/22;G10L21/0272 |
| 代理公司: | 昆明合眾智信知識(shí)產(chǎn)權(quán)事務(wù)所 53113 | 代理人: | 韋群 |
| 地址: | 230000 安徽省合肥市*** | 國(guó)省代碼: | 安徽;34 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 目標(biāo)語(yǔ)音 混合語(yǔ)音 語(yǔ)音交互 數(shù)字信號(hào)指令 環(huán)境聲音 喚醒 參考數(shù)據(jù)信息 采集目標(biāo) 交互系統(tǒng) 目標(biāo)用戶 人機(jī)交互 輸出響應(yīng) 信息翻譯 信息獲取 用戶聲音 語(yǔ)音信息 語(yǔ)音指令 準(zhǔn)確率 底噪 預(yù)設(shè) 語(yǔ)音 | ||
本發(fā)明公開(kāi)了一種語(yǔ)音交互方法及系統(tǒng),語(yǔ)音交互方法具體包括如下操作步驟:S1:獲取包括目標(biāo)用戶語(yǔ)音信息在內(nèi)的環(huán)境混合語(yǔ)音信息;S2:識(shí)別目標(biāo)語(yǔ)音信息并將目標(biāo)語(yǔ)音信息從環(huán)境混合語(yǔ)音信息中分離出;S3:將目標(biāo)語(yǔ)音信息翻譯成數(shù)字信號(hào)指令,根據(jù)數(shù)字信號(hào)指令調(diào)動(dòng)對(duì)應(yīng)程序;S4:輸出響應(yīng)。本發(fā)明能夠通過(guò)人體或語(yǔ)音對(duì)本交互系統(tǒng)進(jìn)行喚醒,操作簡(jiǎn)單,能夠避免由于無(wú)法正確識(shí)別預(yù)設(shè)語(yǔ)音指令而造成無(wú)法喚醒使用的情況,提高系統(tǒng)的喚醒效率,通過(guò)同時(shí)采集目標(biāo)用戶聲音時(shí)段前的環(huán)境聲音,能夠在對(duì)混合語(yǔ)音消除底噪時(shí)提供準(zhǔn)確的環(huán)境聲音參考數(shù)據(jù)信息,有利于提高目標(biāo)語(yǔ)音信息獲取的準(zhǔn)確性,提高人機(jī)交互的準(zhǔn)確率和效率。
技術(shù)領(lǐng)域
本發(fā)明屬于語(yǔ)音交互技術(shù)領(lǐng)域,具體涉及一種語(yǔ)音交互方法及系統(tǒng)。
背景技術(shù)
隨著語(yǔ)音識(shí)別技術(shù)的發(fā)展,語(yǔ)音識(shí)別技術(shù)已經(jīng)進(jìn)入工業(yè)、家電、通信、汽車電子、醫(yī)療、家庭服務(wù)、消費(fèi)電子產(chǎn)品等各個(gè)領(lǐng)域?,F(xiàn)有的語(yǔ)音識(shí)別在于機(jī)器人進(jìn)行語(yǔ)音交互時(shí),由于環(huán)境中存在其他聲音干擾,在進(jìn)行聲音處理時(shí),無(wú)法消除環(huán)境噪聲的影響,因此無(wú)法準(zhǔn)確的獲取目標(biāo)用戶的語(yǔ)音信息,造成在進(jìn)行語(yǔ)音交互時(shí)存在障礙,影響語(yǔ)音交互體驗(yàn)。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種語(yǔ)音交互方法及系統(tǒng),以解決上述背景技術(shù)中提出的問(wèn)題。
為實(shí)現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:一種語(yǔ)音交互方法,具體包括如下操作步驟:
S1:獲取包括目標(biāo)用戶語(yǔ)音信息在內(nèi)的環(huán)境混合語(yǔ)音信息;
S2:識(shí)別目標(biāo)語(yǔ)音信息并將目標(biāo)語(yǔ)音信息從環(huán)境混合語(yǔ)音信息中分離出;
S3:將目標(biāo)語(yǔ)音信息翻譯成數(shù)字信號(hào)指令,根據(jù)數(shù)字信號(hào)指令調(diào)動(dòng)對(duì)應(yīng)程序;
S4:輸出響應(yīng),由指定程序根據(jù)語(yǔ)音交互指令內(nèi)容發(fā)出對(duì)應(yīng)動(dòng)作,并將執(zhí)行結(jié)果反饋至用戶。
優(yōu)選的,所述目標(biāo)用戶語(yǔ)音信息包括聲紋信息。
優(yōu)選的,所述執(zhí)行結(jié)果通過(guò)語(yǔ)音或視頻的方式反饋至用戶。
一種語(yǔ)音交互方法和系統(tǒng),包括語(yǔ)音系統(tǒng)喚醒模塊、語(yǔ)音采集模塊、語(yǔ)音識(shí)別模塊和語(yǔ)音交互主機(jī)、交互結(jié)果輸出模塊,所述語(yǔ)音系統(tǒng)喚醒模塊、語(yǔ)音采集模塊、語(yǔ)音識(shí)別模塊和交互結(jié)果輸出模塊均與語(yǔ)音交互主機(jī)連接,
所述語(yǔ)音系統(tǒng)喚醒模塊包括語(yǔ)音喚醒單元和人體檢測(cè)喚醒單元,所述語(yǔ)音喚醒單元通過(guò)語(yǔ)音對(duì)語(yǔ)音交互系統(tǒng)進(jìn)行喚醒,所述人體檢測(cè)喚醒單元通過(guò)檢測(cè)指定區(qū)域內(nèi)是否存在用戶對(duì)語(yǔ)音交互系統(tǒng)進(jìn)行喚醒;
所述語(yǔ)音采集模塊包括環(huán)境聲音采集單元、目標(biāo)用戶語(yǔ)音采集單元和語(yǔ)音混合單元,所述環(huán)境語(yǔ)音采集單元用于采集環(huán)境中的聲音信息,并將此聲音信息作為混合語(yǔ)音中的底噪,所述目標(biāo)用戶語(yǔ)音采集單元用于在被喚醒后收集目標(biāo)用戶的語(yǔ)音信息,所述語(yǔ)音混合單元對(duì)環(huán)境聲音和目標(biāo)語(yǔ)音進(jìn)行混合增強(qiáng)處理;
所述語(yǔ)音識(shí)別模塊通過(guò)對(duì)混合語(yǔ)音中的底噪進(jìn)行消除來(lái)獲得目標(biāo)語(yǔ)音信息,并將目標(biāo)語(yǔ)音信息翻譯成數(shù)字信號(hào)指令發(fā)送至語(yǔ)音交互主機(jī);
所述語(yǔ)音交互主機(jī)根據(jù)數(shù)字信號(hào)指令,調(diào)動(dòng)指定程序并執(zhí)行數(shù)字信號(hào)指令的內(nèi)容,同時(shí)將執(zhí)行結(jié)果通過(guò)交互結(jié)果輸出模塊反饋至用戶。
優(yōu)選的,所述環(huán)境聲音采集單元一直處于喚醒狀態(tài),所述混合音中包括全部目標(biāo)用戶語(yǔ)音以及目標(biāo)用戶語(yǔ)音采集單元喚醒前設(shè)定時(shí)間至目標(biāo)用戶語(yǔ)音采集單元完成語(yǔ)音采集期間的全部環(huán)境聲音。
優(yōu)選的,所述人體檢測(cè)喚醒單元包括人體檢測(cè)儀、人體識(shí)別攝像頭,當(dāng)檢測(cè)到有人時(shí)且停留時(shí)間達(dá)到設(shè)定時(shí)長(zhǎng),則啟動(dòng)語(yǔ)音交互系統(tǒng),并喚醒語(yǔ)音采集模塊開(kāi)始采集用戶聲音信息。
優(yōu)選的,所述語(yǔ)音喚醒單元通過(guò)接收用戶預(yù)設(shè)語(yǔ)音指令,根據(jù)預(yù)設(shè)語(yǔ)音指令進(jìn)行聲紋驗(yàn)證。
優(yōu)選的,所述交互結(jié)果輸出模塊包括揚(yáng)聲器和顯示屏。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于安徽興博遠(yuǎn)實(shí)信息科技有限公司,未經(jīng)安徽興博遠(yuǎn)實(shí)信息科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910476450.0/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 一種語(yǔ)音掩蔽方法和設(shè)備
- 一種語(yǔ)音信號(hào)處理方法、裝置、終端設(shè)備及介質(zhì)
- 語(yǔ)音模型訓(xùn)練方法、語(yǔ)音識(shí)別方法、裝置、設(shè)備及介質(zhì)
- 一種語(yǔ)音意圖識(shí)別方法及裝置
- 一種語(yǔ)音識(shí)別、及語(yǔ)音識(shí)別模型訓(xùn)練方法及裝置
- 語(yǔ)音分類方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 語(yǔ)音識(shí)別測(cè)試方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 模型訓(xùn)練的方法和裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種語(yǔ)音意圖識(shí)別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 語(yǔ)音數(shù)據(jù)處理方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 語(yǔ)音引導(dǎo)裝置以及具有該語(yǔ)音引導(dǎo)裝置的導(dǎo)航裝置
- 語(yǔ)音切換裝置及語(yǔ)音切換方法
- 一種用于混合語(yǔ)音情感識(shí)別的語(yǔ)音特征篩選方法
- 混合語(yǔ)音識(shí)別方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種多人語(yǔ)音混合中目標(biāo)說(shuō)話人估計(jì)方法及系統(tǒng)
- 混合語(yǔ)音識(shí)別網(wǎng)絡(luò)訓(xùn)練方法、混合語(yǔ)音識(shí)別方法、裝置及存儲(chǔ)介質(zhì)
- 混合語(yǔ)音識(shí)別網(wǎng)絡(luò)訓(xùn)練方法、混合語(yǔ)音識(shí)別方法、裝置及存儲(chǔ)介質(zhì)
- 一種語(yǔ)音分離質(zhì)量評(píng)估方法、裝置及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 語(yǔ)音處理方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 一種智能飲水機(jī)的語(yǔ)音分離方法
- 用于處理語(yǔ)音的方法和裝置
- 語(yǔ)音交互系統(tǒng)及方法
- 連續(xù)交互控制方法和裝置
- 語(yǔ)音交互方法及裝置、車載語(yǔ)音交互設(shè)備及存儲(chǔ)介質(zhì)
- 一種語(yǔ)音交互組網(wǎng)系統(tǒng)及方法
- 語(yǔ)音交互方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種智能語(yǔ)音交互方法、系統(tǒng)及存儲(chǔ)介質(zhì)
- 語(yǔ)音交互方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 語(yǔ)音交互方法及裝置
- 語(yǔ)音交互方法及裝置、語(yǔ)音交互系統(tǒng)、交通工具及介質(zhì)
- 具有加速器的數(shù)字信號(hào)系統(tǒng)及其操作方法
- 一種通過(guò)手機(jī)LED燈進(jìn)行電視遙控的方法和系統(tǒng)
- 空調(diào)控制系統(tǒng)
- 電能計(jì)量信號(hào)處理器的指令譯碼屏蔽系統(tǒng)與方法
- 一種汽車語(yǔ)音指令采集處理系統(tǒng)及方法
- 關(guān)聯(lián)語(yǔ)音信號(hào)與控制指令的方法及控制終端
- 信號(hào)細(xì)分裝置
- 動(dòng)態(tài)調(diào)整數(shù)字信號(hào)處理器性能的方法、存儲(chǔ)介質(zhì)及計(jì)算機(jī)
- 基于指令集的數(shù)字信號(hào)控制系統(tǒng)、FPGA模塊及方法
- 用于加速數(shù)字信號(hào)處理的RISC-V指令集擴(kuò)展方法





