[發(fā)明專利]一種基于語音頻域指紋的方艙對(duì)講機(jī)開啟方法無效
| 申請(qǐng)?zhí)枺?/td> | 201310372408.7 | 申請(qǐng)日: | 2013-08-24 |
| 公開(公告)號(hào): | CN103559883A | 公開(公告)日: | 2014-02-05 |
| 發(fā)明(設(shè)計(jì))人: | 鄭靜晨;郝昱文;李曉雪 | 申請(qǐng)(專利權(quán))人: | 鄭靜晨;郝昱文;李曉雪 |
| 主分類號(hào): | G10L17/04 | 分類號(hào): | G10L17/04;H04Q5/24 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100039*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 語音 指紋 對(duì)講機(jī) 開啟 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及信號(hào)處理、數(shù)據(jù)通信和方艙醫(yī)院等領(lǐng)域,具體的說,本發(fā)明給出了一種基于語音頻域指紋的方艙對(duì)講機(jī)開啟方法,對(duì)講機(jī)可自動(dòng)識(shí)別用戶的語音,然后開啟對(duì)講模式,用戶無需在講話前按下對(duì)講按鈕,便可直接對(duì)講,從而使得用戶的雙手可以更加自由地進(jìn)行其它操作。
背景技術(shù)
市面上常見的對(duì)講機(jī),在用戶需要講話時(shí),需要按下對(duì)講按鈕,才能將自己的語音送入對(duì)講網(wǎng)絡(luò)。
由于用戶在對(duì)講時(shí),有一只手需要按住對(duì)講按鈕,這種使用模式很大程度上限制了用戶的雙手,使得用戶無法自由支配自己的雙手,在野外方艙醫(yī)院中,通常情況都會(huì)比較緊急,普通對(duì)講模式使得對(duì)講機(jī)成為了一個(gè)必須要使用但又不能使用的工具,嚴(yán)重時(shí)甚至可能引起重大事故。
本發(fā)明給出了一種基于語音頻域指紋的方艙對(duì)講機(jī)開啟方法,對(duì)講機(jī)可自動(dòng)識(shí)別用戶的語音,然后開啟對(duì)講模式,用戶無需在講話前按下對(duì)講按鈕,便可直接對(duì)講,從而使得用戶的雙手可以更加自由地進(jìn)行其它操作。
發(fā)明內(nèi)容
本發(fā)明給出了一種基于語音頻域指紋的方艙對(duì)講機(jī)開啟方法,對(duì)講機(jī)可自動(dòng)識(shí)別用戶的語音,然后開啟對(duì)講模式,用戶無需在講話前按下對(duì)講按鈕,便可直接對(duì)講,從而使得用戶的雙手可以更加自由地操作,其具體工作方式如下:
(1)?用戶按下訓(xùn)練模式按鈕,向?qū)χv機(jī)輸入一段口令,然后釋放訓(xùn)練模式按鈕,結(jié)束一次訓(xùn)練,重復(fù)該操作N遍,語音長(zhǎng)度為M個(gè)采樣點(diǎn);
(2)?對(duì)語音進(jìn)行頻域變換,得到頻域語音F,按照50%的重疊率,將F分割為L(zhǎng)個(gè)頻帶,計(jì)算出第i個(gè)音頻第j個(gè)頻帶的語音能量為:?,將保存為音頻樣本,得到樣本音頻頻帶能量的向量;
(3)?計(jì)算樣本音頻各頻帶的能量期望值為:,從而得到樣本音頻頻帶能量的期望音頻指紋向量;
(4)?當(dāng)用戶準(zhǔn)備向?qū)χv網(wǎng)絡(luò)輸入話音時(shí),先向?qū)χv機(jī)輸入訓(xùn)練時(shí)使用的口令,從而采集到現(xiàn)場(chǎng)語音,然后按照樣本語音的處理方法,求得現(xiàn)場(chǎng)語音各頻帶的能量:,得到現(xiàn)場(chǎng)音頻頻帶能量的音頻指紋向量;
(5)?計(jì)算現(xiàn)場(chǎng)音頻各頻帶的能量與樣本音頻各頻帶能量期望的歸一化相關(guān)系數(shù):;
(6)?經(jīng)過多個(gè)樣本測(cè)試,確定門限值,如果,則開啟對(duì)講模式,允許用戶向?qū)χv網(wǎng)絡(luò)輸入語音,否則作下一步操作操作;
(7)計(jì)算現(xiàn)場(chǎng)音頻各頻帶的能量與各樣本音頻各頻帶能量的歸一化相關(guān)系數(shù):,如果的次數(shù)大于N/2,則開啟對(duì)講模式,允許用戶向?qū)χv網(wǎng)絡(luò)輸入語音,否則回到等待模式。
附圖說明
無。
具體實(shí)施方式
本發(fā)明給出了一種基于語音頻域指紋的方艙對(duì)講機(jī)開啟方法,對(duì)講機(jī)可自動(dòng)識(shí)別用戶的語音,然后開啟對(duì)講模式,用戶無需在講話前按下對(duì)講按鈕,便可直接對(duì)講,從而使得用戶的雙手可以更加自由地操作,可以通過在對(duì)講機(jī)中增加一個(gè)軟件模塊的方法進(jìn)行實(shí)現(xiàn),具體的實(shí)現(xiàn)方式如下:
(1)????用戶按下訓(xùn)練模式按鈕,向?qū)χv機(jī)重復(fù)輸入一段口令N遍,語音長(zhǎng)度為M個(gè)采樣點(diǎn);
(2)????按照50%的重疊率將頻域音頻分割為L(zhǎng)個(gè)頻帶,計(jì)算出第i個(gè)音頻第j個(gè)頻帶的語音能量為:,將保存為音頻樣本,得到樣本音頻頻帶能量的向量;
(3)計(jì)算樣本音頻各頻帶的能量期望值為:,從而得到樣本音頻頻帶能量的期望音頻指紋向量;
(4)????當(dāng)用戶準(zhǔn)備向?qū)χv網(wǎng)絡(luò)輸入話音時(shí),先向?qū)χv機(jī)輸入訓(xùn)練時(shí)使用的口令,然后按照樣本語音的處理方法,求得現(xiàn)場(chǎng)語音各頻帶的能量:,得到現(xiàn)場(chǎng)音頻頻帶能量的音頻指紋向量;
(5)????計(jì)算現(xiàn)場(chǎng)音頻各頻帶的能量與樣本音頻各頻帶能量期望的歸一化相關(guān)系數(shù):;
(6)????經(jīng)過多個(gè)樣本測(cè)試,確定門限值,如果,則開啟對(duì)講模式,允許用戶向?qū)χv網(wǎng)絡(luò)輸入語音,否則作下一步操作操作;計(jì)算現(xiàn)場(chǎng)音頻各頻帶的能量與各樣本音頻各頻帶能量的歸一化相關(guān)系數(shù):,如果的次數(shù)大于N/2,則開啟對(duì)講模式,允許用戶向?qū)χv網(wǎng)絡(luò)輸入語音,否則回到等待模式。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于鄭靜晨;郝昱文;李曉雪,未經(jīng)鄭靜晨;郝昱文;李曉雪許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310372408.7/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。





