[發明專利]一種提高嘈雜環境下語音識別率的方法在審

申請號：	201710358269.0	申請日：	2017-05-19
公開（公告）號：	CN107274894A	公開（公告）日：	2017-10-20
發明（設計）人：	范晨	申請（專利權）人：	杭州仁盈科技股份有限公司
主分類號：	G10L15/20	分類號：	G10L15/20;G10L15/26;G10L15/24;G10L15/28
代理公司：	杭州九洲專利事務所有限公司33101	代理人：	陳繼亮
地址：	310020 浙江省杭州市余***	國省代碼：	浙江;33
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種提高嘈雜環境語音識別率方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

技術領域

本發明屬于語音識別技術領域，主要是一種提高嘈雜環境下語音識別率的方法。

背景技術

目前語音識別技術日漸成熟并應用在各個領域。如手機上的各種語音搜索應用、語音發短信、對話聊天軟件、語音導航軟件等等。這些應用都是借助語音識別技術將語音轉換為文字，大大降低了人們使用軟件時輸入的工作量。

當前語音識別技術在提高人們使用便利性的同時，也存在一些問題。如在辦公室內、家里和其它安靜的場合，識別率都非常高；但在比較嘈雜的公共場合環境，識別率就直線跳水，非常低了。識別率變低的原因就是環境噪音和使用者的聲音進行了疊加，對識別軟件造成了干擾。

如在公共場合某些支持語音搜索的自助設備，當客戶說需要的酒店區域的時候，由于噪音的疊加，真實需要的區域“三墩”也許會被它理解為“山東”、“山洞”、甚至“汕頭”。針對這個問題，許多語音識別系統也有一些優化方案，如可以上傳本地的熱詞表到云端識別系統，讓“三墩”這個地名優先被匹配；或者應用軟件自己做區分，將識別到的“山東”，“汕頭”強制轉化為“三墩”。

熱詞表的方案，其實解決的是同音詞的問題。比如說“三墩”這個音，由于該地名比較生僻，如果不加該熱詞，可能會被識別為“三噸”或者“三頓”。這些詞發音完全一致，加上熱詞“三墩”，就是告訴識別云平臺，遇到這個音要優先選擇熱詞“三頓”。所以該方案只能較好得解決同音詞的問題，如果識別聲音源本身受到了干擾，發生了變形，則還是會被識別為其它常見近似語音，如“山東”。

應用軟件自己強制轉換的方案，在一定程度上是可行的，只要在代碼里或者數據字典里做好識別詞組的翻譯即可。如在某包含“三墩”而不需要“山東”等地名的業務場景下，發現識別結果是“山東”、“山洞”或者“汕頭”，就強制轉換為“三墩”，可以滿足業務需求。但該方案的缺陷是，識別結果的不確定導致代碼或者數據字典頻繁更新。比如識別出“扇動”、“閃動”這些詞，其實用戶說的是“三墩”，那么這些詞就得加到數據字典里，強制轉換為“三墩”。下次發現識別出“煽動”，又得繼續加入數據字典。識別結果的不確定導致維護工作量極大。

發明內容

本發明的目的在于克服現有技術存在的不足，而提供一種提高嘈雜環境下語音識別率的方法。

本發明的目的是通過如下技術方案來完成的。這種提高嘈雜環境下語音識別率的方法，該方法包括如下步驟：

第一步：從識別云平臺取得識別結果；

第二步：將識別結果快速翻譯為拼音；

第三步：查詢數據庫配置表，將拼音翻譯為業務需要的文字；

第四步：將翻譯后的文字返回給應用程序。

更進一步的，在第二步中：

(1)、根據漢字的GBK編碼為索引做一個漢字和拼音的映射表，根據漢字的GBK編碼直接定位到漢字的拼音；

(2)、一個漢字的GBK編碼由2個字節組成，分為首字節和末字節，首字節從0xB0到0xF7，末字節從0xA1到0xFE；設計一個漢字拼音映射二維數組pytable，第一行存儲“首字節是0xB0的漢字組”的拼音，第二行存儲“首字節是0xB1的漢字組”的拼音，以此類推，最后一行存儲“首字節是0xF7的漢字組”的拼音；每一組里再按“末字節”編碼的順序存儲；

(3)、將漢字串快速翻譯為拼音串：

第1步，取得要轉換漢字的首字節head；

第2步，判斷head是否小于0xB0；如果小于0xB0，則說明本次檢測的字符不是漢字，走到第7步，繼續檢測下一個漢字；否則往下走到第3步；

第3步，取得該漢字的末字節tail；

第4步，將首字節head減掉0xB0，得到第一維的下標index1；

第5步，將末字節tail減掉0xA1，得到第二維的下標index2；

第6步，得到該漢字的拼音數據pytable[index1][index2]并拼接；

第7步，判斷是否還有漢字串需要轉換，有的話轉到第1步；否則結束；

通過以上步驟，通過計算漢字的GBK編碼，迅速得到了該漢字的拼音。

更進一步的，在第三步中：根據業務的不同，需要配置不同的轉換關系，將這個轉換將通過數據庫查表實現，數據庫配置表里面存儲拼音和漢字的對應關系，通過SQL語句將拼音串轉化為漢字串。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載