[發明專利]語音數據處理方法、裝置及存儲介質在審
| 申請號: | 202010136193.9 | 申請日: | 2020-03-02 |
| 公開(公告)號: | CN111462741A | 公開(公告)日: | 2020-07-28 |
| 發明(設計)人: | 韓立秈;蘇少煒;陳孝良;常樂 | 申請(專利權)人: | 北京聲智科技有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/26;G06F40/30 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 邢少真 |
| 地址: | 100080 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 數據處理 方法 裝置 存儲 介質 | ||
1.一種語音數據處理方法,其特征在于,所述方法包括:
對接收到的語音數據進行語音識別處理,獲取所述語音數據對應的第一文本數據;
對所述第一文本數據進行第一層語義解析,獲得所述第一文本數據的有效性屬性,所述有效性屬性用于指示所述第一文本數據為有效數據或者無效數據;
根據所述有效性屬性,對所述第一文本數據進行語音數據響應或者結束所述語音數據處理。
2.根據權利要求1所述的方法,其特征在于,所述對接收到的語音數據進行語音識別處理,獲取所述語音數據對應的第一文本數據,包括:
對所述語音數據進行語音識別處理,獲得語音識別文本;
根據預先設置的黑名單對所述語音識別文本進行匹配;所述黑名單中包括喚醒詞以及高頻語氣詞中的至少一種;
從所述語音識別文本中刪除與所述黑名單匹配的內容,獲得所述第一文本數據。
3.根據權利要求1所述的方法,其特征在于,所述根據所述有效性屬性,對所述第一文本數據進行語音數據響應或者結束所述語音數據處理,包括:
響應于所述第一文本數據的有效性屬性指示所述第一文本數據為有效數據,通過第二層語義解析或者直接生成所述第一文本數據對應的應答文本;
響應于所述第一文本數據的有效性屬性指示所述第一文本數據為無效數據,丟棄所述第一文本數據。
4.根據權利要求1所述的方法,其特征在于,所述對所述第一文本數據進行第一層語義解析,獲得所述第一文本數據的有效性屬性,包括:
在對所述第一文本數據進行自然語言處理過程中,對所述第一文本數據進行所述第一層語義解析,獲得所述第一文本數據的所述有效性屬性;其中,所述有效性屬性包含關聯屬性、指令屬性以及語境屬性中的至少一種。
5.根據權利要求4所述的方法,其特征在于,當所述有效性屬性包括所述關聯屬性時,所述在對所述第一文本數據進行自然語言處理過程中,對所述第一文本數據進行所述第一層語義解析,獲得所述第一文本數據的所述有效性屬性,包括:
在對所述第一文本數據進行自然語言處理過程中,獲取當前運行的應用程序的屬性以及所述第一文本數據的前n條文本數據,n為大于或等于1的整數;
結合當前運行的所述應用程序的屬性對所述第一文本數據以及所述前n條文本數據進行上下文關系解析,獲得所述關聯屬性,所述關聯屬性用于指示所述第一文本數據與所述前n條文本數據之間是否存在上下文關系。
6.根據權利要求4所述的方法,其特征在于,當所述有效性屬性包括所述指令屬性時,所述在對所述第一文本數據進行自然語言處理過程中,對所述第一文本數據進行所述第一層語義解析,獲得所述第一文本數據的所述有效性屬性,包括:
獲取當前運行的應用程序對應的指令詞庫;
在對所述第一文本數據進行自然語言處理過程中,將所述第一文本數據與所述指令詞庫進行匹配,獲得第一匹配結果;
獲取與所述第一匹配結果相對應的所述指令屬性,所述指令屬性用于指示所述第一文本數據中是否存在所述指令詞庫中的指令詞。
7.根據權利要求4所述的方法,其特征在于,當所述有效性屬性包括所述語境屬性時,所述在對所述第一文本數據進行自然語言處理過程中,對所述第一文本數據進行所述第一層語義解析,獲得所述第一文本數據的所述有效性屬性,包括:
在對所述第一文本數據進行自然語言處理過程中,將所述第一文本數據與指定語境詞庫進行匹配,獲得第二匹配結果;
獲取與所述第二匹配結果相對應的所述語境屬性,所述語境屬性用于指示所述第一文本數據中是否存在所述指定語境詞庫中的語境詞。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京聲智科技有限公司,未經北京聲智科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010136193.9/1.html,轉載請聲明來源鉆瓜專利網。





