[發(fā)明專利]微軟語音識(shí)別配置文件的自動(dòng)切換方法及其系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 201410207282.2 | 申請(qǐng)日: | 2014-05-15 |
| 公開(公告)號(hào): | CN104021146A | 公開(公告)日: | 2014-09-03 |
| 發(fā)明(設(shè)計(jì))人: | 陸成剛;俞珊珊 | 申請(qǐng)(專利權(quán))人: | 浙江工業(yè)大學(xué) |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30;G10L15/07 |
| 代理公司: | 杭州天正專利事務(wù)所有限公司 33201 | 代理人: | 王兵;黃美娟 |
| 地址: | 310014 浙*** | 國(guó)省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 微軟 語音 識(shí)別 配置文件 自動(dòng) 切換 方法 及其 系統(tǒng) | ||
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)語音識(shí)別配置文件的自動(dòng)切換,具體而言,涉及一種微軟語音識(shí)別配置文件的自動(dòng)切換方法及其系統(tǒng)。?
背景技術(shù)
目前,業(yè)內(nèi)主流的語音識(shí)別引擎有微軟、科大訊飛和谷歌等,其中微軟的識(shí)別引擎是基于windows平臺(tái)的本地安裝的訓(xùn)練數(shù)據(jù)庫(kù)進(jìn)行工作,這就決定了它的學(xué)習(xí)樣本集不像科大訊飛、谷歌的部署在云端的語音識(shí)別引擎的數(shù)據(jù)庫(kù)那么龐大。一般來說,微軟的引擎需要用戶進(jìn)行發(fā)聲訓(xùn)練形成存放在本地的適用于該用戶的配置文件。當(dāng)設(shè)置了經(jīng)用戶本人訓(xùn)練的配置文件的默認(rèn)支持后,微軟的引擎語音識(shí)別精度可以達(dá)到令人滿意的程度。?
但是當(dāng)有若干用戶使用同一臺(tái)電腦做語音識(shí)別時(shí)就需要在不同的配置文件之間進(jìn)行切換,當(dāng)前這樣的切換必須完全依賴手動(dòng)操作進(jìn)行。由于配置文件切換的動(dòng)作比較繁瑣:例如在win8系統(tǒng)里,用戶首先要鼠標(biāo)右鍵點(diǎn)中揚(yáng)聲器圖標(biāo)->選擇錄音設(shè)備->在彈出的窗口里繼續(xù)用鼠標(biāo)右鍵選中麥克風(fēng)圖標(biāo)->選中“配置語音識(shí)別”菜單->在彈出的控制面板里選中左上方的“高級(jí)語音選項(xiàng)”->在彈出的語音屬性窗口里勾選用戶對(duì)應(yīng)的配置文件->按確定退出,一共7個(gè)步驟實(shí)現(xiàn)配置文件的切換。在win8系統(tǒng)里如果通過控制面板打開麥克風(fēng)來設(shè)置配置文件的切換則需要10個(gè)步驟。這些操作對(duì)于一般的通過口述編寫文檔的辦公人員等不熟悉windows系統(tǒng)的用戶是一個(gè)沉重的負(fù)擔(dān),本發(fā)明提出了一種自動(dòng)切換配置文件的一步操作方法。?
發(fā)明內(nèi)容
本發(fā)明要解決現(xiàn)有技術(shù)依賴手動(dòng)操作的缺點(diǎn),提供一種微軟語音識(shí)別配置文件的自動(dòng)切換方法及其系統(tǒng)。?
一種配置文件的自動(dòng)切換方法,其特征在于,包括:?
步驟1、在系統(tǒng)初始化階段創(chuàng)建使用同一臺(tái)電腦進(jìn)行語音識(shí)別的用戶的身份信息和配置文件的對(duì)應(yīng)表;?
步驟2、在每一個(gè)人使用語音識(shí)別之前用戶開啟麥克風(fēng)并對(duì)著麥克風(fēng)發(fā)聲,電腦對(duì)說話人的語音身份進(jìn)行識(shí)別,并輸出該用戶的身份信息;?
步驟3、然后系統(tǒng)從對(duì)應(yīng)表文件,根據(jù)該用戶的身份信息查詢到該用戶對(duì)應(yīng)的配置文件名;?
步驟4、系統(tǒng)根據(jù)上一步得到的配置文件名將默認(rèn)配置文件切換到該用戶的配置文件,然后開始進(jìn)入語音識(shí)別的工作。?
進(jìn)一步,步驟2中電腦對(duì)說話人的身份識(shí)別,其具體方式是:開啟麥克風(fēng)根據(jù)輸入音頻的特征分析來進(jìn)行。步驟3中有與語音識(shí)別配置文件列表一一對(duì)應(yīng)的同名字符串表示的配置?文件的說話人身份配置文件對(duì)應(yīng)表。?
一種微軟語音識(shí)別配置文件的自動(dòng)切換系統(tǒng),包括麥克風(fēng)錄音模塊、說話人識(shí)別模塊、說話人身份配置文件對(duì)應(yīng)表、微軟語音識(shí)別引擎配置文件列表、微軟SAPI庫(kù)Helper函數(shù)和自動(dòng)切換模塊;?
麥克風(fēng)錄音模塊是開啟麥克風(fēng)采集用戶環(huán)境的聲學(xué)信號(hào),向說話人識(shí)別模塊輸出;?
說話人識(shí)別模塊根據(jù)采集的聲音信號(hào)分析說話人的聲音音色,向自動(dòng)切換模塊輸出的說話人的身份信息;?
自動(dòng)切換模塊用于自動(dòng)修改默認(rèn)配置文件為該用戶的配置,不需要經(jīng)過繁瑣的手動(dòng)操作;?
說話人身份配置文件對(duì)應(yīng)表用于給自動(dòng)切換模塊提供查詢,以便自動(dòng)切換模塊獲得該說話人所對(duì)應(yīng)的配置文件名;?
微軟語音識(shí)別引擎的微配置文件列表是微軟語音識(shí)別引擎部署在本地的各個(gè)用戶的語音訓(xùn)練特征數(shù)據(jù)的文件名,該列表在切換模塊設(shè)置默認(rèn)配置文件時(shí)遍歷所用;?
微軟SAPI庫(kù)Helper函數(shù)為切換模塊提供了關(guān)于修改默認(rèn)配置文件的接口API。?
本發(fā)明的優(yōu)點(diǎn)是:可以在微軟語音識(shí)別引擎的基礎(chǔ)上實(shí)現(xiàn)自動(dòng)切換不同的配置文件,無需手動(dòng)操作。?
附圖說明
圖1是本發(fā)明實(shí)施例配置文件自動(dòng)切換方法的實(shí)現(xiàn)邏輯示意圖,圖中語音識(shí)別配置文件列表中加粗的配置文件k表示是當(dāng)前用戶的默認(rèn)配置文件。?
圖2是本發(fā)明實(shí)施例的系統(tǒng)功能運(yùn)行邏輯次序圖。?
圖3是本發(fā)明實(shí)施例的系統(tǒng)組件圖,圖中的表示的是“依賴于”。?
具體實(shí)施方式
參照附圖:?
一種配置文件的自動(dòng)切換方法,其特征在于,包括:?
步驟1、在系統(tǒng)初始化階段創(chuàng)建使用同一臺(tái)電腦進(jìn)行語音識(shí)別的用戶的身份信息和配置文件的對(duì)應(yīng)表;?
步驟2、在每一個(gè)人使用語音識(shí)別之前用戶開啟麥克風(fēng)并對(duì)著麥克風(fēng)發(fā)聲,電腦對(duì)說話人的語音身份進(jìn)行識(shí)別,并輸出該用戶的身份信息;?
步驟3、然后系統(tǒng)從對(duì)應(yīng)表文件,根據(jù)該用戶的身份信息查詢到該用戶對(duì)應(yīng)的配置文件名;?
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江工業(yè)大學(xué),未經(jīng)浙江工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410207282.2/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 上一篇:無負(fù)壓真空抑制器
- 下一篇:一種多組件裝配夾具
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 對(duì)微軟媒體格式的點(diǎn)播流媒體數(shù)據(jù)進(jìn)行加密和解密的方法
- 對(duì)微軟媒體格式的點(diǎn)播流媒體數(shù)據(jù)加解密的方法和系統(tǒng)
- WCF RIA Services下集成NHIBERNATE的方法
- 一種醫(yī)用報(bào)告自助服務(wù)系統(tǒng)
- 控制軟件、裝配工位、具有多個(gè)裝配工位的系統(tǒng)、計(jì)算機(jī)可讀的介質(zhì)
- 自動(dòng)化微軟功耗測(cè)試方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種針對(duì)微軟EXCEL文件的數(shù)據(jù)重組修復(fù)方法
- 一種物聯(lián)網(wǎng)設(shè)備接入微軟云的方法及系統(tǒng)
- 基于微軟布署系統(tǒng)的Linux網(wǎng)絡(luò)啟動(dòng)方法及裝置
- TWS藍(lán)牙耳機(jī)控制PC上微軟Teams的方法
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序





