[發明專利]信息處理設備以及信息處理方法有效
| 申請號: | 201410319260.5 | 申請日: | 2014-07-07 |
| 公開(公告)號: | CN104063500B | 公開(公告)日: | 2019-03-29 |
| 發明(設計)人: | 于海濤;趙一方 | 申請(專利權)人: | 聯想(北京)有限公司 |
| 主分類號: | G06F16/61 | 分類號: | G06F16/61;G06F16/903;G10L15/08 |
| 代理公司: | 北京市柳沈律師事務所 11105 | 代理人: | 安之斐 |
| 地址: | 100085*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 信息處理 設備 以及 方法 | ||
信息處理設備以及信息處理方法,所述信息處理設備包括:通信單元,配置來從網絡獲取具有多個第一字符串的第一字符串集合;處理單元,配置來對所述第一字符串集合進行數據擴展以形成第二字符串集合,所述第一字符串集合中的每一個第一字符串與所述第二字符串集合中的至少一個第二字符串對應,對所述第二字符串集合中的每一個第二字符串進行字音標準化處理,并且基于所述字音標準化處理的結果產生索引數據,其中在語音輸入檢索中,所述索引數據用來查找所述第二字符串集合中是否存在與所述語音輸入對應的第二字符串;以及存儲單元,配置來存儲所述第一字符串集合、所述第二字符串集合以及所述索引數據。
技術領域
本發明涉及一種信息處理設備以及信息處理方法。
背景技術
隨著技術的發展,語音識別技術正在得到廣泛的使用。但是,目前已經應用的通用語音識別引擎的識別率通常在75%左右,距離人類96%以上的識別率還有很大的差距。此外,在語音識別引擎的數據庫的內容過多的情況下,語音識別引擎的識別速度也往往不能令人滿意。
因此,希望提供一種能夠提高語音輸入的識別效率以及語音識別速度的技術。
發明內容
為了解決現有技術中的上述技術問題,根據本發明的一方面,提供一種信息處理設備,包括:通信單元,配置來從網絡獲取具有多個第一字符串的第一字符串集合;處理單元,配置來對所述第一字符串集合進行數據擴展以形成第二字符串集合,所述第一字符串集合中的每一個第一字符串與所述第二字符串集合中的至少一個第二字符串對應,對所述第二字符串集合中的每一個第二字符串進行字音標準化處理,并且基于所述字音標準化處理的結果產生索引數據,其中在語音輸入檢索中,所述索引數據用來查找所述第二字符串集合中是否存在與所述語音輸入對應的第二字符串;以及存儲單元,配置來存儲所述第一字符串集合、所述第二字符串集合以及所述索引數據。
此外,根據本發明的一個實施例,其中在所述處理單元進行所述數據擴展期間,所述處理單元基于所述第一字符串的內容確定具有相關內容的至少一個第二字符串。
此外,根據本發明的一個實施例,其中在對第二字符串集合中的每一個第二字符串進行字音標準化期間,所述處理單元將所述第二字符串集合中的每一個第二字符串中的不發音字符排除以產生第三字符串;如果所述第三字符串中存在數字字符,則所述處理單元將所述第三字符串中的數字字符標準化為同一類型的數字字符;以及所述處理單元基于音素或拼音將所述第三字符串劃分為多個音素字符或拼音字符,并且基于所述音素字符或拼音字符產生索引數據。
此外,根據本發明的一個實施例,其中所述索引數據包括所述音素字符或所述拼音字符與所述第二字符串集合中的第二字符的關聯的信息。
此外,根據本發明的一個實施例,所述信息處理設備還包括輸入數據存儲單元,其中在語音輸入檢索期間,所述處理單元將所述語音輸入轉換為第一輸入字符串,并且對所述第一輸入字符串進行字音標準化處理以產生第二輸入字符串作為輸入數據,并且將所述輸入數據存儲在所述輸入數據存儲單元。
此外,根據本發明的一個實施例,其中所述處理單元將基于第二輸入字符串檢索所述索引數據來查找所述第二字符串集合中是否存在與所述語音輸入對應的第二字符串。
此外,根據本發明的另一方面,提供一種信息處理方法,應用于信息處理設備,所述信息處理設備包含通信單元以及存儲單元,所述方法包括:通過所述通信單元從網絡獲取具有多個第一字符串的第一字符串集合;對所述第一字符串集合進行數據擴展以形成第二字符串集合,所述第一字符串集合中的每一個第一字符串與所述第二字符串集合中的至少一個第二字符串對應,對所述第二字符串集合中的每一個第二字符串進行字音標準化處理;基于所述字音標準化處理的結果產生索引數據,其中在語音輸入檢索中,所述索引數據用來查找所述第二字符串集合中是否存在與所述語音輸入對應的第二字符串;以及在所述存儲單元中存儲所述第一字符串集合、所述第二字符串集合以及所述索引數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于聯想(北京)有限公司,未經聯想(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410319260.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種圖計算方法及引擎
- 下一篇:觀點處理方法和裝置以及搜索方法和裝置





