[發明專利]信息處理方法、裝置、計算機設備和存儲介質在審
| 申請號: | 202210032655.1 | 申請日: | 2022-01-12 |
| 公開(公告)號: | CN114333784A | 公開(公告)日: | 2022-04-12 |
| 發明(設計)人: | 梁健龍;王健宗 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G10L15/04 | 分類號: | G10L15/04;G10L15/18;G10L17/18 |
| 代理公司: | 北京辰權知識產權代理有限公司 11619 | 代理人: | 付婧 |
| 地址: | 518048 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 信息處理 方法 裝置 計算機 設備 存儲 介質 | ||
1.一種信息處理方法,其特征在于,所述方法包括:
獲取待處理的語音內容,所述語音內容至少包括第一發言人的語音內容;
基于所述語音內容中語音的靜音片段,將所述語音內容劃分為多個語音片段;
基于所述語音片段的聲紋特征,確定同一發言人對應的語音片段;
提取所述發言人的語音片段中包含的身份關鍵詞和/或禁語關鍵詞;
如果所述語音片段中包含身份關鍵詞,則基于所述身份關鍵詞確定所述發言人是否是所述第一發言人;
如果所述語音片段中包含禁語關鍵詞,則分析禁語關鍵詞的語音片段的語義,得到所述發言人的發言質量的評估結果。
2.根據權利要求1所述的信息處理方法,其特征在于,所述基于所述語音內容中語音的靜音片段,將所述語音內容劃分為多個語音片段,包括:
在所述語音內容的靜音停頓處作為切割點將所述語音內容劃分為多個語音片段,其中,所述靜音停頓處滿足以下條件之一:靜音片段持續第一預設時長、靜音片段第二預設時長內有占比大于預設比例的時長是靜音且沒有超過第三預設時長的連續非靜音。
3.根據權利要求1所述的信息處理方法,其特征在于,所述基于所述語音片段的聲紋特征,確定同一發言人對應的語音片段,包括:
對多個語音片段的聲紋進行聚類,得到多個聚類結果;
確定每個聚類結果中的多個語音片段對應于同一發言人。
4.根據權利要求1所述的信息處理方法,其特征在于,所述提取所述發言人的語音片段中包含的身份關鍵詞和/或禁語關鍵詞,包括:
分別將每個聚類結果的語音片段轉換為文本數據;
采用自然語言處理方式,提取所述語音片段進行身份關鍵詞和/或禁語關鍵詞。
5.根據權利要求4所述的信息處理方法,其特征在于,所述分別將每個聚類結果的語音片段轉換為文本數據,包括:
將語音片段轉寫為文本數據,對所述文本數據進行字母大小寫轉換;
根據歷史發言人會話文本數據判斷文本轉寫合理或文本轉寫錯誤,所述歷史發言人會話文本數據是命中服務禁語的發言人會話內容且命中的禁語關鍵詞是轉寫錯誤的。
6.根據權利要求4所述的信息處理方法,其特征在于,所述根據歷史發言人會話文本數據判斷文本轉寫合理或文本轉寫錯誤,包括:
收集一批歷史發言人會話文本數據,所收集的歷史發言人會話文本數據是命中服務禁語關鍵詞的發言人會話內容且命中的服務禁語關鍵詞是轉寫錯誤的;
基于收集到的歷史發言人會話文本數據,訓練語言模型;
對命中服務禁語關鍵詞的發言人會話內容進行預測,基于語言模型通過歷史發言人會話文本數據計算句子概率,句子概率的計算值超過句子概率閾值時判斷文本轉寫合理,否則判斷文本轉寫錯誤。
7.根據權利要求1所述的信息處理方法,其特征在于,所述如果所述語音片段中包含身份關鍵詞,則基于所述身份關鍵詞確定所述發言人是否是所述第一發言人,包括:
對所述身份關鍵詞進行歸一化處理,得到所述身份關鍵詞的第一特征數據;
采用計算特征之間的距離的方式,將所述第一特征數據與預設的表征第一發言人身份的第一特征信息進行相似度比較得到相似度比較結果,根據所述比較結果確定所述發言人是否是第一發言人;
對所述禁語關鍵詞進行歸一化處理,得到所述禁語關鍵詞的第二特征數據;
采用計算特征之間的距離的方式,將所述第二特征數據與預設的表征服務禁語的第二特征信息進行匹配度比較得到匹配度比較結果,對所述發言人的服務質量進行評價。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210032655.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:數據核驗方法、裝置、電子設備及存儲介質
- 下一篇:一種流體輸送的異常檢測系統





