[發明專利]話術檢測方法和話術檢測裝置在審
| 申請號: | 202110258035.5 | 申請日: | 2021-03-10 |
| 公開(公告)號: | CN112634900A | 公開(公告)日: | 2021-04-09 |
| 發明(設計)人: | 鄧玉龍;劉瓊瓊;丁文彪;劉子韜 | 申請(專利權)人: | 北京世紀好未來教育科技有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/18;G10L15/26 |
| 代理公司: | 北京開陽星知識產權代理有限公司 11710 | 代理人: | 安偉 |
| 地址: | 100089 北京市海淀區中*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 檢測 方法 裝置 | ||
1.一種話術檢測方法,其特征在于,包括:
獲取至少一個預設的熱詞;
針對每個熱詞,獲取所述熱詞對應的擴展拼音集合,所述擴展拼音集合包括所述熱詞的全拼,以及所述全拼對應的模糊拼音;
獲取所述擴展拼音集合對應的第一非標準拼音集合,其中,所述第一非標準拼音集合中的第一非標準拼音的部分字母與所述擴展拼音集合中的拼音的部分字母滿足預設對應關系;
獲取所述第一非標準拼音集合對應的第二非標準拼音集合,其中,所述第二非標準拼音集合中的各第二非標準拼音與對應的所述第一非標準拼音的編輯距離小于等于預設閾值;
獲取標準拼音集合,其中,所述標準拼音集合中的標準拼音的部分字母與所述第二非標準拼音集合中的第二非標準拼音的部分字母滿足所述預設對應關系;
獲取待檢測語音文本的拼音序列中與所述標準拼音集合中相同的目標拼音,并將所述目標拼音對應的熱詞作為話術檢測結果。
2.根據權利要求1所述的話術檢測方法,其特征在于,所述獲取所述熱詞對應的擴展拼音集合,包括:
獲取所述熱詞的全拼;
根據模糊音對照表中聲母模糊音對照關系、韻母模糊音對照關系和/或字母組合模糊音對照關系,獲取所述全拼對應的模糊拼音;
根據所述全拼和所述全拼對應的模糊拼音,確定所述擴展拼音集合。
3.根據權利要求1或2所述的話術檢測方法,其特征在于,所述獲取所述擴展拼音集合對應的第一非標準拼音集合,包括:
根據非標準拼音對照表中字母對照關系和/或字母組合對照關系,獲取所述全拼對應的第一非標準拼音,以及所述模糊拼音對應的第一非標準拼音。
4.根據權利要求3所述的話術檢測方法,其特征在于,所述獲取標準拼音集合,包括:
根據所述非標準拼音對照表中字母對照關系和/或字母組合對照關系,獲取所述第二非標準拼音集合中的所述第二非標準拼音對應的標準拼音。
5.根據權利要求1所述的話術檢測方法,其特征在于,所述獲取待檢測語音文本的拼音序列中與所述標準拼音集合中相同的目標拼音,包括:
根據標準拼音與漢字的對應關系,刪除所述標準拼音集合中與所述漢字不存在對應關系的無效標準拼音,獲取有效標準拼音集合;
根據所述有效標準拼音集合中的有效標準拼音,遍歷所述待檢測語音文本的拼音序列,獲取所述拼音序列中與所述有效標準拼音集合中相同的目標拼音。
6.根據權利要求1所述的話術檢測方法,其特征在于,還包括:
獲取語音識別文本的分類結果;
所述將所述目標拼音對應的熱詞作為話術檢測結果,包括:
將所述目標拼音對應的熱詞,以及所述待檢測語音文本對應的分類結果作為所述話術檢測結果。
7.根據權利要求6所述的話術檢測方法,其特征在于,所述獲取語音識別文本的分類結果,包括:
將所述語音識別文本中的所述至少一個熱詞替換為統一的標識符號;
根據替換后的語音識別文本,獲取所述分類結果。
8.根據權利要求1所述的話術檢測方法,其特征在于,所述獲取待檢測語音文本的拼音序列中與所述標準拼音集合中相同的目標拼音之前,還包括:
若語音識別文本中的第一個標點符號之前包括一個漢字,將所述第一個標點符號之前的所述一個漢字修正為兩個相同的漢字;
若所述語音識別文本中包括英文字母,將所述英文字母修正為與所述英文字母的發音相同的漢字;
根據修正后的語音識別文本,獲取所述待檢測的語音文本。
9.根據權利要求7所述的話術檢測方法,其特征在于,所述將所述語音識別文本中的所述至少一個熱詞替換為統一的標識符號之前;還包括:
對待檢測音頻進行標準化處理;
根據標準化的待檢測音頻,獲取所述語音識別文本。
10.一種話術檢測裝置,其特征在于,包括:
熱詞獲取模塊,用于獲取至少一個預設的熱詞;
拼音擴展模塊,用于針對每個熱詞,獲取所述熱詞對應的擴展拼音集合,所述擴展拼音集合包括所述熱詞的全拼,以及所述全拼對應的模糊拼音;
第一非標準化模塊,用于獲取所述擴展拼音集合對應的第一非標準拼音集合,其中,所述第一非標準拼音集合中的第一非標準拼音的部分字母與所述擴展拼音集合中的拼音的部分字母滿足預設對應關系;
第二非標準化模塊,用于獲取所述第一非標準拼音集合對應的第二非標準拼音集合,其中,所述第二非標準拼音集合中的各第二非標準拼音與對應的所述第一非標準拼音的編輯距離小于等于預設閾值;
標準化模塊,用于獲取標準拼音集合,其中,所述標準拼音集合中的標準拼音的部分字母與所述第二非標準拼音集合中的第二非標準拼音的部分字母滿足所述預設對應關系;
檢測模塊,用于獲取待檢測語音文本的拼音序列中與所述標準拼音集合中相同的目標拼音,并將所述目標拼音對應的熱詞作為話術檢測結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京世紀好未來教育科技有限公司,未經北京世紀好未來教育科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110258035.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種提升速度快的液壓修井機
- 下一篇:一種雙光路煙霧感測芯片及煙霧感測方法





