[發明專利]近音文字匹配方法及裝置有效
| 申請號: | 201310476514.X | 申請日: | 2013-10-12 |
| 公開(公告)號: | CN103577548B | 公開(公告)日: | 2017-02-08 |
| 發明(設計)人: | 梁捷;范興 | 申請(專利權)人: | 優視科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京弘權知識產權代理事務所(普通合伙)11363 | 代理人: | 陳蕾,許偉群 |
| 地址: | 100080 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文字 匹配 方法 裝置 | ||
技術領域
本發明涉及移動通信技術領域,特別是涉及近音文字匹配方法及裝置。
背景技術
現有技術在語音交互過程中,客戶端搜集用戶的音頻信息,進一步將該音頻信息轉換為對應的文本信息,客戶端將該本文信息發送到語音服務器進行語義分析,最終向客戶端返回相應的執行指令。
在客戶端將搜集到的語音信息轉換為對應的文本信息的過程中,可能存在文本信息與語音信息之間的偏差,導致客戶端發送給語音服務器的文本信息與搜集到的語音信息之間存在偏差,例如,搜集到的語音信息為“打開新浪”,而客戶端轉換得到的文本信息為“大楷新郎”,其中,“打”和“大”兩個字的讀音相近均為“da”,不同之處僅是音調不同,即“打”和“大”為近音字,同理,“開”和“楷”也為近音字,“郎”和“浪”也為近音字。近音字并非僅指讀音包含的字母及字母的排序相同的漢字,其中,讀音中包含的字母相差不多的漢字也可以定義為近音字,例如,讀音“an”和“ang”。由于近音字的存在,客戶端的語音信息轉換成文本信息的過程可能存在偏差,導致提供給語音服務器的文本信息與客戶端接收到的語音信息的語義可能不匹配。
上述情況,需要語音服務器能夠對接收到的文本信息做相應的近音模糊匹配處理,提高容錯性和語音交互的有效性和智能性。而且,語音交互是客戶端與用戶之間直接進行語音交互,為提高用戶的語音交互體驗,需要語音服務器具備快速和高效地處理及響應能力,因此,急需一種近音文字匹配方法提高語音服務器的響應速度和效率。
發明內容
本發明實施例中提供了一種近音文字匹配方法及裝置,以提高語音服務器的響應速度和效率。為了解決上述技術問題,本發明實施例公開了如下技術方案:
一方面,本申請提供了一種近音文字匹配方法,包括:
接收文本信息;
根據所述文本信息的區位碼信息生成對應的數字音值,其中,所述文本信息中讀音相近的文字對應的數字音值相同;
將所述文本信息的數字音值逐一與依據關鍵詞的數字音值預先構建的關鍵詞樹的節點數值進行匹配,直到匹配結果滿足終止條件,所述終止條件包括所述文本信息中的文字匹配完或匹配到所述關鍵詞樹中的可終止的節點;
依據所述匹配結果得到相應的操作指令。
優選地,所述方法還包括:
根據文字的區位碼信息,獲取由文字對應的數字音值構成的數字音值字典表;
依據關鍵詞構建以所述關鍵詞中文字對應的數字音值為節點的關鍵詞樹。
優選地,根據所述文本信息的區位碼信息生成對應的數字音值的步驟包括:
獲取文本信息中各個文字的區位碼信息;
從所述數字音值字典表中查找所述各個文字的區位碼信息對應的數字音值。
優選地,所述獲取文本信息中各個文字的區位碼信息的步驟包括:依據各個文字中GB2312編碼中的ASCII碼值計算得到所述各個文字的區位碼信息。
優選地,按照以下步驟完成將所述文本信息的數字音值逐一與依據關鍵詞的數字音值預先構建的關鍵詞樹的節點數值進行匹配,直到匹配結果滿足終止條件:
匹配所述文本信息的當前文字的數字音值與關鍵詞樹的節點的數值是否相同,若所述文本信息的數字音值與關鍵詞樹的節點的數值相同,依據關鍵詞樹的所述節點的輔助信息判斷所述節點是否是終結節點,其中,所述輔助信息包括所述節點所包含的近音字、表明所述節點是否為終結節點的屬性信息,所述節點對應的響應指令,以及所述響應指令對應的操作對象;
若所述節點不是終結節點,判斷所述文本信息的各個文字是否匹配完,若匹配完,進入依據所述匹配結果得到相應的操作指令的步驟;
若未匹配完,更新所述當前文字的數字音值為下一文字的數字音值,進入匹配所述文本信息的當前文字的數字音值與關鍵詞樹的節點的數值是否相同的步驟。
另一方面,本申請還提供一種近音文本匹配裝置,包括:
接收單元,用于接收文本信息;
數字音值獲取單元,用于根據文本信息的區位碼信息生成對應的數字音值,其中,所述文本信息中讀音相近的文字對應的數字音值相同;
匹配單元,用于將所述文本信息的數字音值逐一與依據關鍵詞的數字音值預先構建的關鍵詞樹的節點數值進行匹配,直到匹配結果滿足終止條件,所述終止條件包括所述文本信息中的文字匹配完或匹配到所述關鍵詞樹中的可終止的節點;
操作指令生成單元,用于依據所述匹配結果生成相應的操作指令。
優選地,所述裝置還包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于優視科技有限公司,未經優視科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310476514.X/2.html,轉載請聲明來源鉆瓜專利網。





