[發(fā)明專利]一種基于語音控制展廳的方法及控制系統(tǒng)在審
| 申請?zhí)枺?/td> | 202011543435.2 | 申請日: | 2020-12-23 |
| 公開(公告)號: | CN112700773A | 公開(公告)日: | 2021-04-23 |
| 發(fā)明(設(shè)計(jì))人: | 鐘生;彭鵬;汪剛 | 申請(專利權(quán))人: | 合肥金人科技有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G07C9/37 |
| 代理公司: | 合肥市浩智運(yùn)專利代理事務(wù)所(普通合伙) 34124 | 代理人: | 張景云 |
| 地址: | 230011 安徽省合肥市高新區(qū)習(xí)友路與*** | 國省代碼: | 安徽;34 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 語音 控制 展廳 方法 控制系統(tǒng) | ||
1.一種基于語音控制展廳的方法,其特征在于,包括以下步驟:
步驟一:門禁單元采集人臉信息數(shù)據(jù),確認(rèn)人員是否為工作人員,如果是則進(jìn)入步驟二;如果不是工作人員,確認(rèn)為訪客后,則進(jìn)入步驟三;
步驟二:確認(rèn)為工作人員后,門禁解除,此時(shí)為普通模式,工作人員進(jìn)入展廳內(nèi);
步驟三:此時(shí)為會客模式,展廳內(nèi)的燈光和空調(diào)自動開啟,語音交互系統(tǒng)管理主機(jī)自動喚醒,智能語音主機(jī)播報(bào)致歡迎詞和序言介紹,播報(bào)環(huán)境探測器監(jiān)測到的數(shù)據(jù);
步驟四:需要調(diào)整展廳的燈光、空調(diào)等智能設(shè)備,工作人員對智能語音主機(jī)說出意圖,語音交互系統(tǒng)管理主機(jī)理解意圖并響應(yīng),并發(fā)出控制指令給ZigBee網(wǎng)關(guān),進(jìn)而控制相對應(yīng)的智能設(shè)備;工作人員還可以對移動終端,比如手機(jī)、對講機(jī)說出控制指令,通過無線AP也能夠語音控制各個設(shè)備的運(yùn)行;
步驟五:工作人員走到相應(yīng)的展示區(qū)內(nèi),通過話筒進(jìn)行提問,語音交互系統(tǒng)管理主機(jī)進(jìn)行處理,對訪客進(jìn)行解說;
步驟六:工作人員需要在顯示屏上展示介紹信息時(shí),發(fā)出播放指令,顯示屏播放介紹的內(nèi)容,工作人員可以通過語音控制播放過程中的音量大小、暫停、切換等功能;
步驟七:訪客參觀結(jié)束后,工作人員對智能語音主機(jī)說出關(guān)閉智能設(shè)備的指令,智能語音主機(jī)響應(yīng),語音交互系統(tǒng)管理主機(jī)控制相應(yīng)的設(shè)備關(guān)閉。
2.根據(jù)權(quán)利要求1所述的一種基于語音控制展廳的方法,其特征在于,語音交互的具體過程為:
1)首先對接收到的聲音信號預(yù)加重,并進(jìn)行分幀操作;具體的是在聲音信號的頻域乘以系數(shù)K,系數(shù)K跟頻率成正相關(guān);
s’n=sn-k*sn-1
對預(yù)加重后的聲音信號乘以凱澤窗函數(shù)進(jìn)行分幀,形成多個波形段;
其中,I0是第一類零階貝塞爾函數(shù),M為窗的個數(shù),n窗的長度,w(n)為頻譜函數(shù),β是用來調(diào)整窗函數(shù)性能的參數(shù),此處β選8.5;
2)對多個波形段進(jìn)行快速傅里葉變換得到對應(yīng)的頻譜,將上面的頻譜通過Mel濾波器組得到Mel頻譜;在Mel頻譜上面進(jìn)行倒譜分析,獲得Mel頻率倒譜系數(shù)MFCC,生成每幀的MFCC特征向量;
3)預(yù)先構(gòu)建聲學(xué)模型和語言模型,通過大量標(biāo)注的語音數(shù)據(jù)訓(xùn)練聲學(xué)模型,通過大量標(biāo)注的文本數(shù)據(jù)訓(xùn)練語言模型;聲學(xué)模型用于把語音輸入轉(zhuǎn)換層聲學(xué)表示的輸入,在聲學(xué)模型給出發(fā)音序列之后,從候選的文字序列中找出概率最大的字符串序列;
4)對聲音信號對應(yīng)的指令轉(zhuǎn)化為可識別的語言,包括:確定指令的領(lǐng)域,理解指令的意圖、定位詞槽;
5)處理用戶的真實(shí)的意圖,做出相應(yīng)的回答反饋。
3.根據(jù)權(quán)利要求1所述的一種基于語音控制展廳的方法,其特征在于,門禁單元的工作過程為:
1)預(yù)先獲取人臉圖像;
2)對獲取到的人臉圖像進(jìn)行燒苗檢測,生成于候選區(qū)域?qū)?yīng)的人臉坐標(biāo);
3)根據(jù)人臉坐標(biāo)生成雙眼的坐標(biāo),在候選區(qū)域內(nèi)通過人臉坐標(biāo)和雙眼的坐標(biāo)生成人臉面部特征向量(其中需要對候選區(qū)域進(jìn)行平移、旋轉(zhuǎn)和縮放,形成具有預(yù)定大小的標(biāo)準(zhǔn)化圖像,其中雙眼的坐標(biāo)鏈接到預(yù)定位置,對人臉圖像進(jìn)行歸一化處理),保存在服務(wù)器內(nèi),形成人臉數(shù)據(jù)庫;
4)將待驗(yàn)證的人臉采集圖像與人臉數(shù)據(jù)庫中的特征向量進(jìn)行比較,計(jì)算距離值,比較距離值與相似性閾值,確定人員的身份,完成識別的過程。
4.一種基于語音控制的展廳控制系統(tǒng),其特征在于:包括語音交互系統(tǒng)管理主機(jī)、智能語音主機(jī)、物聯(lián)控制主機(jī)、環(huán)境探測器、門禁單元、ZigBee網(wǎng)關(guān)、無線AP、智能設(shè)備;
所述語音交互系統(tǒng)管理主機(jī)、智能語音主機(jī)、環(huán)境探測器、門禁單元、無線AP、智能設(shè)備通過ZigBee網(wǎng)關(guān)與物聯(lián)控制主機(jī)通信連接。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于合肥金人科技有限公司,未經(jīng)合肥金人科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011543435.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





