[發(fā)明專利]一種基于語音頻域指紋的方艙對(duì)講機(jī)開啟方法無效

申請(qǐng)?zhí)枺?/td>	201310372408.7	申請(qǐng)日：	2013-08-24
公開（公告）號(hào)：	CN103559883A	公開（公告）日：	2014-02-05
發(fā)明（設(shè)計(jì)）人：	鄭靜晨;郝昱文;李曉雪	申請(qǐng)（專利權(quán)）人：	鄭靜晨;郝昱文;李曉雪
主分類號(hào)：	G10L17/04	分類號(hào)：	G10L17/04;H04Q5/24
代理公司：	暫無信息	代理人：	暫無信息
地址：	100039***	國(guó)省代碼：	北京;11
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	一種基于語音指紋對(duì)講機(jī) 開啟方法
鉆瓜網(wǎng) 技術(shù)展會(huì) 專利詞庫(kù) 專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

技術(shù)領(lǐng)域

本發(fā)明涉及信號(hào)處理、數(shù)據(jù)通信和方艙醫(yī)院等領(lǐng)域，具體的說，本發(fā)明給出了一種基于語音頻域指紋的方艙對(duì)講機(jī)開啟方法，對(duì)講機(jī)可自動(dòng)識(shí)別用戶的語音，然后開啟對(duì)講模式，用戶無需在講話前按下對(duì)講按鈕，便可直接對(duì)講，從而使得用戶的雙手可以更加自由地進(jìn)行其它操作。

背景技術(shù)

市面上常見的對(duì)講機(jī)，在用戶需要講話時(shí)，需要按下對(duì)講按鈕，才能將自己的語音送入對(duì)講網(wǎng)絡(luò)。

由于用戶在對(duì)講時(shí)，有一只手需要按住對(duì)講按鈕，這種使用模式很大程度上限制了用戶的雙手，使得用戶無法自由支配自己的雙手，在野外方艙醫(yī)院中，通常情況都會(huì)比較緊急，普通對(duì)講模式使得對(duì)講機(jī)成為了一個(gè)必須要使用但又不能使用的工具，嚴(yán)重時(shí)甚至可能引起重大事故。

本發(fā)明給出了一種基于語音頻域指紋的方艙對(duì)講機(jī)開啟方法，對(duì)講機(jī)可自動(dòng)識(shí)別用戶的語音，然后開啟對(duì)講模式，用戶無需在講話前按下對(duì)講按鈕，便可直接對(duì)講，從而使得用戶的雙手可以更加自由地進(jìn)行其它操作。

發(fā)明內(nèi)容

本發(fā)明給出了一種基于語音頻域指紋的方艙對(duì)講機(jī)開啟方法，對(duì)講機(jī)可自動(dòng)識(shí)別用戶的語音，然后開啟對(duì)講模式，用戶無需在講話前按下對(duì)講按鈕，便可直接對(duì)講，從而使得用戶的雙手可以更加自由地操作，其具體工作方式如下：

(1)?用戶按下訓(xùn)練模式按鈕，向?qū)χv機(jī)輸入一段口令，然后釋放訓(xùn)練模式按鈕，結(jié)束一次訓(xùn)練，重復(fù)該操作N遍，語音長(zhǎng)度為M個(gè)采樣點(diǎn)；

(2)?對(duì)語音進(jìn)行頻域變換，得到頻域語音F，按照50%的重疊率，將F分割為L(zhǎng)個(gè)頻帶，計(jì)算出第i個(gè)音頻第j個(gè)頻帶的語音能量為：?，將保存為音頻樣本，得到樣本音頻頻帶能量的向量；

(3)?計(jì)算樣本音頻各頻帶的能量期望值為：，從而得到樣本音頻頻帶能量的期望音頻指紋向量；

(4)?當(dāng)用戶準(zhǔn)備向?qū)χv網(wǎng)絡(luò)輸入話音時(shí)，先向?qū)χv機(jī)輸入訓(xùn)練時(shí)使用的口令，從而采集到現(xiàn)場(chǎng)語音，然后按照樣本語音的處理方法，求得現(xiàn)場(chǎng)語音各頻帶的能量：，得到現(xiàn)場(chǎng)音頻頻帶能量的音頻指紋向量；

(5)?計(jì)算現(xiàn)場(chǎng)音頻各頻帶的能量與樣本音頻各頻帶能量期望的歸一化相關(guān)系數(shù)：；

(6)?經(jīng)過多個(gè)樣本測(cè)試，確定門限值，如果，則開啟對(duì)講模式，允許用戶向?qū)χv網(wǎng)絡(luò)輸入語音，否則作下一步操作操作；

(7)計(jì)算現(xiàn)場(chǎng)音頻各頻帶的能量與各樣本音頻各頻帶能量的歸一化相關(guān)系數(shù)：，如果的次數(shù)大于N/2，則開啟對(duì)講模式，允許用戶向?qū)χv網(wǎng)絡(luò)輸入語音，否則回到等待模式。

附圖說明

無。

具體實(shí)施方式

本發(fā)明給出了一種基于語音頻域指紋的方艙對(duì)講機(jī)開啟方法，對(duì)講機(jī)可自動(dòng)識(shí)別用戶的語音，然后開啟對(duì)講模式，用戶無需在講話前按下對(duì)講按鈕，便可直接對(duì)講，從而使得用戶的雙手可以更加自由地操作，可以通過在對(duì)講機(jī)中增加一個(gè)軟件模塊的方法進(jìn)行實(shí)現(xiàn)，具體的實(shí)現(xiàn)方式如下：

(1)????用戶按下訓(xùn)練模式按鈕，向?qū)χv機(jī)重復(fù)輸入一段口令N遍，語音長(zhǎng)度為M個(gè)采樣點(diǎn)；

(2)????按照50%的重疊率將頻域音頻分割為L(zhǎng)個(gè)頻帶，計(jì)算出第i個(gè)音頻第j個(gè)頻帶的語音能量為：，將保存為音頻樣本，得到樣本音頻頻帶能量的向量；

(3)計(jì)算樣本音頻各頻帶的能量期望值為：，從而得到樣本音頻頻帶能量的期望音頻指紋向量；

(4)????當(dāng)用戶準(zhǔn)備向?qū)χv網(wǎng)絡(luò)輸入話音時(shí)，先向?qū)χv機(jī)輸入訓(xùn)練時(shí)使用的口令，然后按照樣本語音的處理方法，求得現(xiàn)場(chǎng)語音各頻帶的能量：，得到現(xiàn)場(chǎng)音頻頻帶能量的音頻指紋向量；

(5)????計(jì)算現(xiàn)場(chǎng)音頻各頻帶的能量與樣本音頻各頻帶能量期望的歸一化相關(guān)系數(shù)：；

(6)????經(jīng)過多個(gè)樣本測(cè)試，確定門限值，如果，則開啟對(duì)講模式，允許用戶向?qū)χv網(wǎng)絡(luò)輸入語音，否則作下一步操作操作；計(jì)算現(xiàn)場(chǎng)音頻各頻帶的能量與各樣本音頻各頻帶能量的歸一化相關(guān)系數(shù)：，如果的次數(shù)大于N/2，則開啟對(duì)講模式，允許用戶向?qū)χv網(wǎng)絡(luò)輸入語音，否則回到等待模式。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會(huì)員可以免費(fèi)下載。

免登錄下載普通用戶下載升級(jí)VIP會(huì)員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于鄭靜晨;郝昱文;李曉雪，未經(jīng)鄭靜晨;郝昱文;李曉雪許可，擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請(qǐng)聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201310372408.7/2.html，轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。

上一篇：川崎病的診斷標(biāo)志物和治療靶點(diǎn)
下一篇：鋰離子電池正極活性材料的制備方法

同類專利

專利分類

G 物理

G10 樂器；聲學(xué)
G10L 語音分析或合成；語音識(shí)別；音頻分析或處理
G10L17-00 講話者辨認(rèn)或驗(yàn)證

免登錄下載普通用戶下載升級(jí)VIP會(huì)員，免費(fèi)下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實(shí)用新型專利、外觀設(shè)計(jì)專利（升級(jí)中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級(jí)為極速版,下載速度顯著提升！歡迎使用！

請(qǐng)您登陸后，進(jìn)行下載，點(diǎn)擊【登陸】【注冊(cè)】