[發明專利]一種提高嘈雜環境下語音識別率的方法在審
| 申請號: | 201710358269.0 | 申請日: | 2017-05-19 |
| 公開(公告)號: | CN107274894A | 公開(公告)日: | 2017-10-20 |
| 發明(設計)人: | 范晨 | 申請(專利權)人: | 杭州仁盈科技股份有限公司 |
| 主分類號: | G10L15/20 | 分類號: | G10L15/20;G10L15/26;G10L15/24;G10L15/28 |
| 代理公司: | 杭州九洲專利事務所有限公司33101 | 代理人: | 陳繼亮 |
| 地址: | 310020 浙江省杭州市余*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 提高 嘈雜 環境 語音 識別率 方法 | ||
技術領域
本發明屬于語音識別技術領域,主要是一種提高嘈雜環境下語音識別率的方法。
背景技術
目前語音識別技術日漸成熟并應用在各個領域。如手機上的各種語音搜索應用、語音發短信、對話聊天軟件、語音導航軟件等等。這些應用都是借助語音識別技術將語音轉換為文字,大大降低了人們使用軟件時輸入的工作量。
當前語音識別技術在提高人們使用便利性的同時,也存在一些問題。如在辦公室內、家里和其它安靜的場合,識別率都非常高;但在比較嘈雜的公共場合環境,識別率就直線跳水,非常低了。識別率變低的原因就是環境噪音和使用者的聲音進行了疊加,對識別軟件造成了干擾。
如在公共場合某些支持語音搜索的自助設備,當客戶說需要的酒店區域的時候,由于噪音的疊加,真實需要的區域“三墩”也許會被它理解為“山東”、“山洞”、甚至“汕頭”。針對這個問題,許多語音識別系統也有一些優化方案,如可以上傳本地的熱詞表到云端識別系統,讓“三墩”這個地名優先被匹配;或者應用軟件自己做區分,將識別到的“山東”,“汕頭”強制轉化為“三墩”。
熱詞表的方案,其實解決的是同音詞的問題。比如說“三墩”這個音,由于該地名比較生僻,如果不加該熱詞,可能會被識別為“三噸”或者“三頓”。這些詞發音完全一致,加上熱詞“三墩”,就是告訴識別云平臺,遇到這個音要優先選擇熱詞“三頓”。所以該方案只能較好得解決同音詞的問題,如果識別聲音源本身受到了干擾,發生了變形,則還是會被識別為其它常見近似語音,如“山東”。
應用軟件自己強制轉換的方案,在一定程度上是可行的,只要在代碼里或者數據字典里做好識別詞組的翻譯即可。如在某包含“三墩”而不需要“山東”等地名的業務場景下,發現識別結果是“山東”、“山洞”或者“汕頭”,就強制轉換為“三墩”,可以滿足業務需求。但該方案的缺陷是,識別結果的不確定導致代碼或者數據字典頻繁更新。比如識別出“扇動”、“閃動”這些詞,其實用戶說的是“三墩”,那么這些詞就得加到數據字典里,強制轉換為“三墩”。下次發現識別出“煽動”,又得繼續加入數據字典。識別結果的不確定導致維護工作量極大。
發明內容
本發明的目的在于克服現有技術存在的不足,而提供一種提高嘈雜環境下語音識別率的方法。
本發明的目的是通過如下技術方案來完成的。這種提高嘈雜環境下語音識別率的方法,該方法包括如下步驟:
第一步:從識別云平臺取得識別結果;
第二步:將識別結果快速翻譯為拼音;
第三步:查詢數據庫配置表,將拼音翻譯為業務需要的文字;
第四步:將翻譯后的文字返回給應用程序。
更進一步的,在第二步中:
(1)、根據漢字的GBK編碼為索引做一個漢字和拼音的映射表,根據漢字的GBK編碼直接定位到漢字的拼音;
(2)、一個漢字的GBK編碼由2個字節組成,分為首字節和末字節,首字節從0xB0到0xF7,末字節從0xA1到0xFE;設計一個漢字拼音映射二維數組pytable,第一行存儲“首字節是0xB0的漢字組”的拼音,第二行存儲“首字節是0xB1的漢字組”的拼音,以此類推,最后一行存儲“首字節是0xF7的漢字組”的拼音;每一組里再按“末字節”編碼的順序存儲;
(3)、將漢字串快速翻譯為拼音串:
第1步,取得要轉換漢字的首字節head;
第2步,判斷head是否小于0xB0;如果小于0xB0,則說明本次檢測的字符不是漢字,走到第7步,繼續檢測下一個漢字;否則往下走到第3步;
第3步,取得該漢字的末字節tail;
第4步,將首字節head減掉0xB0,得到第一維的下標index1;
第5步,將末字節tail減掉0xA1,得到第二維的下標index2;
第6步,得到該漢字的拼音數據pytable[index1][index2]并拼接;
第7步,判斷是否還有漢字串需要轉換,有的話轉到第1步;否則結束;
通過以上步驟,通過計算漢字的GBK編碼,迅速得到了該漢字的拼音。
更進一步的,在第三步中:根據業務的不同,需要配置不同的轉換關系,將這個轉換將通過數據庫查表實現,數據庫配置表里面存儲拼音和漢字的對應關系,通過SQL語句將拼音串轉化為漢字串。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州仁盈科技股份有限公司,未經杭州仁盈科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710358269.0/2.html,轉載請聲明來源鉆瓜專利網。





