[發(fā)明專利]文本修正方法、裝置、智能設備及可讀存儲介質在審
| 申請?zhí)枺?/td> | 201810420439.8 | 申請日: | 2018-05-04 |
| 公開(公告)號: | CN108804414A | 公開(公告)日: | 2018-11-13 |
| 發(fā)明(設計)人: | 謝韜;顧鵬程 | 申請(專利權)人: | 科沃斯商用機器人有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27 |
| 代理公司: | 北京太合九思知識產權代理有限公司 11610 | 代理人: | 劉戈 |
| 地址: | 215104 江蘇省蘇州市蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 關鍵詞庫 原始文本 文本 修正 可讀存儲介質 目標關鍵詞 語義 分詞結果 文本修正 智能設備 分詞 相似度比對 輸入語音 誤判率 相似度 預設 申請 | ||
本申請?zhí)峁┮环N文本修正方法、裝置、智能設備及可讀存儲介質,所述方法包括:獲取輸入語音的原始文本,以及所述原始文本的分詞結果;將所述分詞結果中的一個或多個分詞與預設關鍵詞庫中關鍵詞進行相似度比對,確定滿足相似度條件的目標關鍵詞;通過所述目標關鍵詞修正對應的分詞,得到修正文本。本申請通過關鍵詞庫對原始文本中的詞進行修正,由于關鍵詞庫中的每個關鍵詞具有一定的語義,從而能夠將文本中識別錯誤的關鍵詞修正為正確的具有一定語義的詞,進而可以提高文本可靠性,降低文本的誤判率。
技術領域
本申請涉及語音處理技術領域,尤其涉及一種文本修正方法、裝置、智能設備及可讀存儲介質。
背景技術
在智能人機交互系統(tǒng)(例如機器人語音對話系統(tǒng))中,由于語音識別技術自身存在的問題以及周圍環(huán)境等因素的影響,系統(tǒng)將用戶輸入的語音識別成文本后,通常會出現(xiàn)識別錯誤(例如,構詞錯誤、語義錯誤等)的問題。在人機對話過程中,文本中的關鍵詞對句子的含義起決定性作用,尤其在垂直領域場景(例如,銀行、政府、商場等)中,文本中的關鍵詞的正確識別決定了機器人的業(yè)務處理能力。
在相關技術中,在將語音識別成文本后,通常是采用N元模型去修正文本中的錯字錯詞。然而,這種修正方法并沒有考慮詞的語義,導致修正后的文本的誤判率比較高。
發(fā)明內容
有鑒于此,本申請?zhí)峁┮环N文本修正方法、裝置、智能設備及可讀存儲介質,以解決現(xiàn)有技術中由于沒有考慮詞的語義,導致修正后的文本的誤判率高的問題。
根據本申請實施例的第一方面,提供一種文本修正方法,所述方法包括:
獲取輸入語音的原始文本,以及所述原始文本的分詞結果;
將所述分詞結果中的一個或多個分詞與預設關鍵詞庫中關鍵詞進行相似度比對,確定滿足相似度條件的目標關鍵詞;
通過所述目標關鍵詞修正對應的分詞,得到修正文本。
根據本申請實施例的第二方面,提供一種文本修正裝置,所述裝置包括:
獲取單元,用于獲取輸入語音的原始文本,以及所述原始文本的分詞結果;
比對單元,用于將所述分詞結果中的一個或多個分詞與預設關鍵詞庫中關鍵詞進行相似度比對,確定滿足相似度條件的目標關鍵詞;
修正單元,用于通過所述目標關鍵詞修正對應的分詞,得到修正文本。
根據本申請實施例的第三方面,提供一種智能設備,所述設備包括:
語音采集模塊,用于采集輸入語音;
存儲器,用于存儲文本修正的控制邏輯對應的機器可讀指令;
處理器,用于讀取所述存儲器上的所述機器可讀指令,并執(zhí)行所述指令以實現(xiàn)如下操作:
獲取輸入語音的原始文本,以及所述原始文本的分詞結果;
將所述分詞結果中的一個或多個分詞與預設關鍵詞庫中關鍵詞進行相似度比對,確定滿足相似度條件的目標關鍵詞;
通過所述目標關鍵詞修正對應的分詞,得到修正文本。
根據本申請實施例的第四方面,提供一種可讀存儲介質,所述可讀存儲介質內存儲有若干計算機指令,所述計算機指令被執(zhí)行時進行如下處理:
獲取輸入語音的原始文本,以及所述原始文本的分詞結果;
將所述分詞結果中的一個或多個分詞與預設關鍵詞庫中關鍵詞進行相似度比對,確定滿足相似度條件的目標關鍵詞;
通過所述目標關鍵詞修正對應的分詞,得到修正文本。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于科沃斯商用機器人有限公司,未經科沃斯商用機器人有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810420439.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:文本作弊的識別方法及裝置
- 下一篇:一種本體調試信息的度量與排序方法





