[發明專利]語音識別后文本的糾錯方法及糾錯裝置有效
| 申請號: | 201710256101.9 | 申請日: | 2017-04-19 |
| 公開(公告)號: | CN107045496B | 公開(公告)日: | 2021-01-05 |
| 發明(設計)人: | 洪光華;劉兆來 | 申請(專利權)人: | 暢捷通信息技術股份有限公司 |
| 主分類號: | G06F40/211 | 分類號: | G06F40/211;G06F40/216;G06F40/242;G06F40/253;G06F40/289;G06F16/33;G06F16/35;G10L15/26 |
| 代理公司: | 北京友聯知識產權代理事務所(普通合伙) 11343 | 代理人: | 尚志峰;汪海屏 |
| 地址: | 100094 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 文本 糾錯 方法 裝置 | ||
本發明提供了一種語音識別后文本的糾錯方法及糾錯裝置。其中,一種語音識別后文本的糾錯方法,包括:對語音識別后文本進行預處理;對預處理后的文本進行搜索意圖的識別;根據識別出的搜索意圖,確定待抽取的屬性信息,從預處理后的文本中抽取屬性信息;計算屬性信息與候選詞庫中任一候選詞的相似度,根據相似度對抽取出的屬性信息進行糾錯。通過本發明的技術方案,實現人機自有交互,有效解決語音搜索中語音識別不準的問題,提高語音識別的準確率,滿足企業搜索需求,提升用戶體驗。
技術領域
本發明涉及語音搜索技術領域,具體而言,涉及一種語音識別后文本的糾錯方法,還涉及一種語音識別后文本的糾錯裝置。
背景技術
在日常工作生活中,經常遇到從企業員工管理系統中查找員工信息或者從企業客戶關系管理系統中查找客戶信息的需求,傳統的查找聯系人信息的方式一般有兩種:一是在特定的輸入框,輸入聯系人的姓名、電話號碼等;二是翻閱整個通訊錄。這兩種方式在某些場景下均存在不方便操作的缺點,比如在商場、地鐵等擁擠的場合,此外,依次翻閱通訊錄,當通訊錄條目很多時,不但耗時還容易漏掉要查找的信息。
隨著智能設備的普及和自然語言處理技術的發展,語音輸入因其方便、快捷的特性而成為越來越重要的人機交互手段。但是由于語言的復雜多樣和周圍噪聲影響,語音識別的結果往往與用戶實際想輸入的內容有較大的偏差,這就需要針對語音識別后的文本做進一步的糾錯處理,才能應用到實際系統中。
因此,如何提供一種適用于通訊錄搜索的語音識別后文本糾錯方案,能夠有效解決通訊錄語音搜索中語音識別不準的問題,成為目前亟待解決的技術問題。
發明內容
本發明旨在至少解決現有技術或相關技術中存在的技術問題之一。
為此,本發明的一個目的在于提出了一種語音識別后文本的糾錯方法。
本發明的另一個目的在于提出了一種語音識別后文本的糾錯裝置。
有鑒于此,本發明提出了一種語音識別后文本的糾錯方法,包括:對語音識別后文本進行預處理;對預處理后的文本進行搜索意圖的識別;根據識別出的搜索意圖,確定待抽取的屬性信息,從預處理后的文本中抽取屬性信息;計算屬性信息與候選詞庫中任一候選詞的相似度,根據相似度對抽取出的屬性信息進行糾錯。
根據本發明的語音識別后文本的糾錯方法,通過對語音識別后文本進行預處理、識別搜索意圖、抽取屬性信息,并計算屬性信息與候選詞庫中的任一候選詞的相似度,根據相似度值的高低對抽取出的屬性信息進行糾錯,從而有效解決語音搜索中語音識別不準的問題,提高了語音識別的準確率,滿足企業搜索需求,實現人機自由交互,提升用戶體驗。
另外,根據本發明上述的語音識別后文本的糾錯方法,還可以具有如下附加的技術特征:
在上述技術方案中,優選地,預處理的具體步驟,包括:將糾錯詞典內若干詞匯與語音識別后文本進行比對,當糾錯詞典內的某一詞匯存在于語音識別后文本中,則直接用糾錯詞典內的某一詞匯對應的正確詞匯替換語音識別后文本中與糾錯詞典內的某一詞匯相同的詞匯;刪除語音識別后文本中包含的語氣詞;刪除語音識別后文本中包含的標點。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于暢捷通信息技術股份有限公司,未經暢捷通信息技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710256101.9/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:燈裝配件
- 下一篇:一種車燈中光學單元間的調節裝置





