[發明專利]基于用戶意圖分析的語音識別矯正方法及其系統在審
| 申請號: | 202111448714.5 | 申請日: | 2021-12-01 |
| 公開(公告)號: | CN114333788A | 公開(公告)日: | 2022-04-12 |
| 發明(設計)人: | 游海濤;吳昊 | 申請(專利權)人: | 廈門萬勢順易科技有限公司 |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L15/22;G10L15/26;G06F16/35;G06F40/242;G06F40/295 |
| 代理公司: | 北京權智天下知識產權代理事務所(普通合伙) 11638 | 代理人: | 余喜娣 |
| 地址: | 361000 福建省廈門市思*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 用戶 意圖 分析 語音 識別 矯正 方法 及其 系統 | ||
本發明涉及語音識別矯正技術領域,具體涉及到基于用戶意圖分析的語音識別矯正方法及其系統。本申請的基于用戶意圖分析的語音識別矯正方法,通過建立客制化字典數據庫,獲取用戶輸入的語音信息,并根據客制化字典數據庫轉化為文本信息;根據所述文本信息進行意圖分析;根據意圖分析結果進行命名實體識別,并提取實體;基于拼音及數據庫根據提取實體進行錯字替換,并輸出正確文本信息,以及更新客制化字典數據庫,實現其不需要遵從特定句式,且不需要不斷的人機交互,澄清,以及不需要額外的操作,同時也不必考慮澄清不準的代價,快速幫助用戶完成正確字的匹配,提升用戶的體驗感。
技術領域
本發明涉及語音識別矯正技術領域,具體涉及到基于用戶意圖分析的語音識別矯正方法及其系統。
背景技術
近年隨著語音識別、人機對話、自然語言處理等技術迅猛發展。但是現有的語音識別矯正存在以下問題:一、交互使用特定正則表達式判斷意圖無法完整泛化,如現有公開的使用正則表達式來判斷句子是否為對前一句的處理口令,甚至有的要求用戶使用特定的提示詞如,第一形式:修改,字A是詞B的字C;第二形式:修改,第N個字A是詞B的字C。這種方法雖能有效解決問題但不夠智能,且每個人都有自己講話的邏輯順序,限定口令模式對用戶來說并不友好。
二、使用特定正則表達式判斷槽位及槽位上下文無法完整泛化:同第一項類似,使用正則抓到字A是詞B的字C要求用戶套用固定的格式,關鍵字詞以外的上下文必須相同,當遇到口吃、雜音,補充說明等情況常常識別錯誤,適應性差。
三、不具備學習能力;
四、反復交互,復雜的對話管理影響用戶體驗,即使用詞槽澄清或列出 topk個不確定詞給用戶選擇,大大增加了用戶的使用負擔。
發明內容
本發明的目的在于至少解決現有技術中存在的技術問題之一,提供基于用戶意圖分析的語音識別矯正方法及其系統。
為實現上述目的,本發明采用的技術方案如下:基于用戶意圖分析的語音識別矯正方法,包括以下方法:
S1、建立客制化字典數據庫;
S2、獲取用戶輸入的語音信息,并根據客制化字典數據庫轉化為文本信息;
S3、根據所述文本信息進行意圖分析;
S4、根據意圖分析結果使用基于神經網絡的BERT+BILSTM+CRF模型進行命名實體識別,并提取實體;
S5、基于拼音及數據庫根據提取實體進行錯字替換,并輸出正確文本信息;
進一步的,意圖分析包括純語音信息識別、刪除語音信息、編輯語音信息中的一種或多種,其中所述刪除語音信息包含:根據不同情景,進行實體提取,指定語句刪除。
進一步的,當意圖分析為編輯語音信息或刪除語音信息,則進入命名實體識別;反之,則進行純語音信息識別。
進一步的,意圖分析采用bert文本分類模型,將句子中的單字word embedding輸入bert文本分類模型預測句子的類別,且當softmax層后的三個意圖的預測概率中最大值不到88%,則本句的意圖為純語音信息識別;若在此情況下確實想表達的是編輯語音信息或刪除語音信息,則說明文本意圖不夠明顯,需換一種邏輯重新說明。
進一步的,命名實體包括必填詞槽、非必填詞槽,所述必填詞槽包括被修正字、線索詞組、組成成分中的一種或多種;所述非必填詞槽包括組成成分詞組、被修正字詞組、指定序數詞中的一種或多種。
進一步的,步驟S5中基于拼音及數據庫根據提取實體進行錯字替換包括:
將提取實體和待處理文本信息轉化為拼音,并進行匹配;
根據匹配結果確認正確字索引位置;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廈門萬勢順易科技有限公司,未經廈門萬勢順易科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111448714.5/2.html,轉載請聲明來源鉆瓜專利網。





