[發明專利]微軟語音識別配置文件的自動切換方法及其系統在審
| 申請號: | 201410207282.2 | 申請日: | 2014-05-15 |
| 公開(公告)號: | CN104021146A | 公開(公告)日: | 2014-09-03 |
| 發明(設計)人: | 陸成剛;俞珊珊 | 申請(專利權)人: | 浙江工業大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G10L15/07 |
| 代理公司: | 杭州天正專利事務所有限公司 33201 | 代理人: | 王兵;黃美娟 |
| 地址: | 310014 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 微軟 語音 識別 配置文件 自動 切換 方法 及其 系統 | ||
技術領域
本發明涉及計算機語音識別配置文件的自動切換,具體而言,涉及一種微軟語音識別配置文件的自動切換方法及其系統。?
背景技術
目前,業內主流的語音識別引擎有微軟、科大訊飛和谷歌等,其中微軟的識別引擎是基于windows平臺的本地安裝的訓練數據庫進行工作,這就決定了它的學習樣本集不像科大訊飛、谷歌的部署在云端的語音識別引擎的數據庫那么龐大。一般來說,微軟的引擎需要用戶進行發聲訓練形成存放在本地的適用于該用戶的配置文件。當設置了經用戶本人訓練的配置文件的默認支持后,微軟的引擎語音識別精度可以達到令人滿意的程度。?
但是當有若干用戶使用同一臺電腦做語音識別時就需要在不同的配置文件之間進行切換,當前這樣的切換必須完全依賴手動操作進行。由于配置文件切換的動作比較繁瑣:例如在win8系統里,用戶首先要鼠標右鍵點中揚聲器圖標->選擇錄音設備->在彈出的窗口里繼續用鼠標右鍵選中麥克風圖標->選中“配置語音識別”菜單->在彈出的控制面板里選中左上方的“高級語音選項”->在彈出的語音屬性窗口里勾選用戶對應的配置文件->按確定退出,一共7個步驟實現配置文件的切換。在win8系統里如果通過控制面板打開麥克風來設置配置文件的切換則需要10個步驟。這些操作對于一般的通過口述編寫文檔的辦公人員等不熟悉windows系統的用戶是一個沉重的負擔,本發明提出了一種自動切換配置文件的一步操作方法。?
發明內容
本發明要解決現有技術依賴手動操作的缺點,提供一種微軟語音識別配置文件的自動切換方法及其系統。?
一種配置文件的自動切換方法,其特征在于,包括:?
步驟1、在系統初始化階段創建使用同一臺電腦進行語音識別的用戶的身份信息和配置文件的對應表;?
步驟2、在每一個人使用語音識別之前用戶開啟麥克風并對著麥克風發聲,電腦對說話人的語音身份進行識別,并輸出該用戶的身份信息;?
步驟3、然后系統從對應表文件,根據該用戶的身份信息查詢到該用戶對應的配置文件名;?
步驟4、系統根據上一步得到的配置文件名將默認配置文件切換到該用戶的配置文件,然后開始進入語音識別的工作。?
進一步,步驟2中電腦對說話人的身份識別,其具體方式是:開啟麥克風根據輸入音頻的特征分析來進行。步驟3中有與語音識別配置文件列表一一對應的同名字符串表示的配置?文件的說話人身份配置文件對應表。?
一種微軟語音識別配置文件的自動切換系統,包括麥克風錄音模塊、說話人識別模塊、說話人身份配置文件對應表、微軟語音識別引擎配置文件列表、微軟SAPI庫Helper函數和自動切換模塊;?
麥克風錄音模塊是開啟麥克風采集用戶環境的聲學信號,向說話人識別模塊輸出;?
說話人識別模塊根據采集的聲音信號分析說話人的聲音音色,向自動切換模塊輸出的說話人的身份信息;?
自動切換模塊用于自動修改默認配置文件為該用戶的配置,不需要經過繁瑣的手動操作;?
說話人身份配置文件對應表用于給自動切換模塊提供查詢,以便自動切換模塊獲得該說話人所對應的配置文件名;?
微軟語音識別引擎的微配置文件列表是微軟語音識別引擎部署在本地的各個用戶的語音訓練特征數據的文件名,該列表在切換模塊設置默認配置文件時遍歷所用;?
微軟SAPI庫Helper函數為切換模塊提供了關于修改默認配置文件的接口API。?
本發明的優點是:可以在微軟語音識別引擎的基礎上實現自動切換不同的配置文件,無需手動操作。?
附圖說明
圖1是本發明實施例配置文件自動切換方法的實現邏輯示意圖,圖中語音識別配置文件列表中加粗的配置文件k表示是當前用戶的默認配置文件。?
圖2是本發明實施例的系統功能運行邏輯次序圖。?
圖3是本發明實施例的系統組件圖,圖中的表示的是“依賴于”。?
具體實施方式
參照附圖:?
一種配置文件的自動切換方法,其特征在于,包括:?
步驟1、在系統初始化階段創建使用同一臺電腦進行語音識別的用戶的身份信息和配置文件的對應表;?
步驟2、在每一個人使用語音識別之前用戶開啟麥克風并對著麥克風發聲,電腦對說話人的語音身份進行識別,并輸出該用戶的身份信息;?
步驟3、然后系統從對應表文件,根據該用戶的身份信息查詢到該用戶對應的配置文件名;?
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江工業大學,未經浙江工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410207282.2/2.html,轉載請聲明來源鉆瓜專利網。





