[發明專利]話術檢測方法和話術檢測裝置在審
| 申請號: | 202110258035.5 | 申請日: | 2021-03-10 |
| 公開(公告)號: | CN112634900A | 公開(公告)日: | 2021-04-09 |
| 發明(設計)人: | 鄧玉龍;劉瓊瓊;丁文彪;劉子韜 | 申請(專利權)人: | 北京世紀好未來教育科技有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/18;G10L15/26 |
| 代理公司: | 北京開陽星知識產權代理有限公司 11710 | 代理人: | 安偉 |
| 地址: | 100089 北京市海淀區中*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 檢測 方法 裝置 | ||
本發明涉及一種話術檢測方法和話術檢測裝置。該話術檢測方法包括:獲取至少一個預設的熱詞;針對每個熱詞,獲取所述熱詞對應的擴展拼音集合,所述擴展拼音集合包括所述熱詞的全拼,以及所述全拼對應的模糊拼音;獲取所述擴展拼音集合對應的第一非標準拼音集合;獲取所述第一非標準拼音集合對應的第二非標準拼音集合;獲取標準拼音集合;獲取待檢測語音文本的拼音序列中與所述標準拼音集合中相同的目標拼音,并將所述目標拼音對應的熱詞作為話術檢測結果。該話術檢測方法能夠提話術檢測的準確度。
技術領域
本公開涉及語音識別技術領域,尤其涉及一種話術檢測方法和話術檢測裝置。
背景技術
話術檢測,是指對音頻中的一些特定內容進行檢測。其過程為輸入音頻文件和相關的熱詞列表,檢測自動語音識別后的文本是否包含違禁的話或者是否包含特定熱詞(比如:人名、昵稱等),或者是否包含贊揚、引導、糾正內容等。
現有技術中,話術檢測一般采用簡單的關鍵詞匹配的方法檢測音頻中的熱詞,導致話術檢測的準確性較低。
發明內容
為了解決上述技術問題或者至少部分地解決上述技術問題,本發明實施例提供了一種話術檢測方法和話術檢測裝置,能夠提高話術檢測的準確性。
第一方面,本發明實施例提供了一種話術檢測方法,包括:
獲取至少一個預設的熱詞;
針對每個熱詞,獲取所述熱詞對應的擴展拼音集合,所述擴展拼音集合包括所述熱詞的全拼,以及所述全拼對應的模糊拼音;
獲取所述擴展拼音集合對應的第一非標準拼音集合,其中,所述第一非標準拼音集合中的第一非標準拼音的部分字母與所述擴展拼音集合中的拼音的部分字母滿足預設對應關系;
獲取所述第一非標準拼音集合對應的第二非標準拼音集合,其中,所述第二非標準拼音集合中的各第二非標準拼音與對應的所述第一非標準拼音的編輯距離小于等于預設閾值;
獲取標準拼音集合,其中,所述標準拼音集合中的標準拼音的部分字母與所述第二非標準拼音集合中的第二非標準拼音的部分字母滿足所述預設對應關系;
獲取待檢測語音文本的拼音序列中與所述標準拼音集合中相同的目標拼音,并將所述目標拼音對應的熱詞作為話術檢測結果。
可選地,所述獲取所述熱詞對應的擴展拼音集合,包括:
獲取所述熱詞的全拼;
根據模糊音對照表中聲母模糊音對照關系、韻母模糊音對照關系和/或字母組合模糊音對照關系,獲取所述全拼對應的模糊拼音;
根據所述全拼和所述全拼對應的模糊拼音,確定所述擴展拼音集合。
可選地,所述獲取所述擴展拼音集合對應的第一非標準拼音集合,包括:
根據非標準拼音對照表中字母對照關系和/或字母組合對照關系,獲取所述全拼對應的第一非標準拼音,以及所述模糊拼音對應的第一非標準拼音。
可選地,所述獲取標準拼音集合,包括:
根據所述非標準拼音對照表中字母對照關系和/或字母組合對照關系,獲取所述第二非標準拼音集合中的所述第二非標準拼音對應的標準拼音。
可選地,所述獲取待檢測語音文本的拼音序列中與所述標準拼音集合中相同的目標拼音,包括:
根據標準拼音與漢字的對應關系,刪除所述標準拼音集合中與所述漢字不存在對應關系的無效標準拼音,獲取有效標準拼音集合;
根據所述有效標準拼音集合中的有效標準拼音,遍歷所述待檢測語音文本的拼音序列,獲取所述拼音序列中與所述有效標準拼音集合中相同的目標拼音。
可選地,話術檢測方法還包括:
獲取語音識別文本的分類結果;
所述將所述目標拼音對應的熱詞作為話術檢測結果,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京世紀好未來教育科技有限公司,未經北京世紀好未來教育科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110258035.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種提升速度快的液壓修井機
- 下一篇:一種雙光路煙霧感測芯片及煙霧感測方法





