[發明專利]基于對話系統的語音文本處理方法、裝置、設備及介質在審
| 申請號: | 202011271192.1 | 申請日: | 2020-11-13 |
| 公開(公告)號: | CN112395857A | 公開(公告)日: | 2021-02-23 |
| 發明(設計)人: | 吳信朝;周宸;周寶;陳遠旭 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F40/211 | 分類號: | G06F40/211;G06F16/33;G06F16/332;G06K9/62;G10L17/22 |
| 代理公司: | 深圳眾鼎專利商標代理事務所(普通合伙) 44325 | 代理人: | 周燕君 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 對話 系統 語音 文本 處理 方法 裝置 設備 介質 | ||
1.一種基于對話系統的語音文本處理方法,其特征在于,包括:
接收包含目標語音句子的調整指令;所述目標語音句子是指對話系統中的語音識別文本中被對話對象標識出的待調整句子;所述語音識別文本是指對所述對話對象和對話系統中的機器人之間的對話語音進行語音識別之后的文本;
根據預設的詞向量字典,對所述目標語音句子進行詞向量轉換,得到與所述目標語音句子中各目標字詞分別對應的目標詞向量;
自所述語音識別文本中獲取與所述目標語音句子關聯的所有上下文句子,根據所述預設的詞向量字典,對各所述上下文句子進行詞向量轉換,得到與所有所述上下文句子對應的上下文表示向量;
根據所述上下文表示向量,確定各所述目標詞向量對應的向量權重,并根據所述向量權重調整所述目標語音句子,以得到新的目標語音句子;
根據所述新的目標語音句子更新所述對話系統中的所述語音識別文本之后,提示調整完成。
2.如權利要求1所述的基于對話系統的語音文本處理方法,其特征在于,所述根據預設的詞向量字典,對所述目標語音句子進行詞向量轉換,得到與所述目標語音句子中各目標字詞分別對應的目標詞向量,包括:
對所述目標語音句子進行分詞處理,得到多個所述目標字詞;
根據所述預設的詞向量字典,確定與各所述目標字詞對應的目標詞向量。
3.如權利要求1所述的基于對話系統的語音文本處理方法,其特征在于,所述根據所述預設的詞向量字典,對各所述上下文句子進行詞向量轉換,得到與所有所述上下文句子對應的上下文表示向量,包括:
對所述上下文句子進行分詞處理,得到所述上下文句子中的多個上下文字詞;
根據所述預設的詞向量字典,確定與所述上下文句子中的各上下文字詞對應的上下文詞向量;
對與同一上下文句子對應的所有所述上下文詞向量進行第一累加處理,得到與該上下文句子對應的句子向量;
對與各所述上下文句子對應的所有所述句子向量進行第二累加處理,得到所述上下文表示向量。
4.如權利要求1所述的基于對話系統的語音文本處理方法,其特征在于,所述根據所述上下文表示向量,確定各所述目標詞向量對應的向量權重,包括:
對所述上下文表示向量與各所述目標詞向量進行點積處理,得到與各所述目標詞向量對應的點積詞向量,并根據各所述點積詞向量構建詞向量數組;
通過預設分類模型對所述詞向量數組進行歸一化處理,得到與所述詞向量數組對應的向量權重數組;
根據所述向量權重數組,獲取與各所述目標詞向量對應的向量權重;所述各目標詞向量對應的向量權重的和為1。
5.如權利要求1所述的基于對話系統的語音文本處理方法,其特征在于,所述根據預設的詞向量字典,對所述目標語音句子進行詞向量轉換之前,還包括:
獲取訓練樣本集以及包含初始參數的預設語言模型;所述訓練樣本集中包括至少一個訓練樣本;所述預設語言模型中包含預設訓練詞典;
將所述訓練樣本輸入至所述預設語言模型中,根據所述預設訓練詞典,對各所述訓練樣本進行詞向量預測處理,得到各訓練樣本中每一字符對應的預測詞向量;
對各所述預測詞向量進行解碼處理,得到與各預測詞向量對應的預測字詞;
將各預測字詞按照與其對應的訓練樣本中各字符的排列順序進行結合,得到預測句子;
根據所述預測句子以及所述訓練樣本,確定所述預設語言模型的預測損失值;
在所述預測損失值未達到預設收斂條件時,迭代更新所述預設語言模型的初始參數,直至所述預測損失值達到所述預設收斂條件時,將收斂之后的所述預設語言模型記錄為詞向量語言模型。
6.如權利要求1所述的基于對話系統的語音文本處理方法,其特征在于,所述將收斂之后的所述預設語言模型記錄為詞向量語言模型之后,還包括:
將所述訓練樣本輸入至所述詞向量語言模型中,得到與各訓練樣本中每個字詞對應的樣本詞向量;
將各所述樣本詞向量存儲至所述預設訓練詞典中,并將存儲之后的預設訓練詞典記錄為所述預設詞向量字典。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011271192.1/1.html,轉載請聲明來源鉆瓜專利網。





