[發明專利]彩鈴識別的方法及系統、電子設備及存儲介質有效
| 申請號: | 202010953701.2 | 申請日: | 2020-09-11 |
| 公開(公告)號: | CN112087726B | 公開(公告)日: | 2022-08-23 |
| 發明(設計)人: | 鄧艷江;羅超;胡泓;李巍 | 申請(專利權)人: | 攜程旅游網絡技術(上海)有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G10L19/02;G10L17/04;G10L15/26 |
| 代理公司: | 上海弼興律師事務所 31283 | 代理人: | 楊東明;張冉 |
| 地址: | 200335*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 識別 方法 系統 電子設備 存儲 介質 | ||
本發明公開了一種彩鈴識別的方法及系統、電子設備及存儲介質。其中,彩鈴識別的方法包括以下步驟:將輸入的音頻信號轉換為文本;判斷是否存在與所述文本匹配的關鍵詞;若是,則將所述音頻信號識別為彩鈴;若否,則將所述音頻信號輸入至彩鈴分類模型,并根據所述彩鈴分類模型的預測結果確定所述音頻信號是否為彩鈴;其中,所述彩鈴分類模型基于訓練樣本訓練得到,所述訓練樣本包括彩鈴樣本以及包括人聲的非彩鈴樣本。本發明通過對音頻信號轉換得到的文本進行關鍵詞匹配以識別彩鈴,若未成功匹配,則將音頻信號輸入彩鈴分類模型進行二次識別,即同時利用文本和音頻進行彩鈴的識別,提高了彩鈴識別的準確率。
技術領域
本發明涉及計算機技術領域,特別涉及一種彩鈴識別的方法及系統、電子設備及存儲介質。
背景技術
隨著人工智能技術的發展,很多重復性的工作將交由機器完成,客服機器人就是一種實例。彩鈴是個性化多彩回鈴音業務的簡稱,是一項由被叫客戶為呼叫自己移動電話的其他主叫客戶設定特殊音效(音樂、歌曲、故事情節、人物對話)的回鈴音的業務。
客服機器人在使用過程中,通過語音識別功能會誤將彩鈴中包含的文字內容識別出來,從而導致下游的意圖識別以及會話管理實效,進而使整個會話流程發生錯誤。因此,識別出彩鈴并不讓其進入下游的意圖識別以及會話管理變得十分必要。
目前的彩鈴大致可以分為三類:其一是純背景音樂;其二是純人聲播報,例如:歡迎您致電某某大酒店等;其三是伴隨有背景音樂的人聲播報。對于前兩類彩鈴,可以使用傳統文本匹配的方法進行識別。而對于第三類彩鈴,由于背景音樂的存在,導致客服機器人無法識別出完整的句子,因此利用文本匹配的方法無法準確地將其識別出來,從而導致彩鈴識別的準確率降低。
發明內容
本發明要解決的技術問題是為了克服現有技術中無法準確識別伴隨有背景音樂的人聲播報的彩鈴的缺陷,提供一種彩鈴識別方法及系統、電子設備及存儲介質。
本發明是通過下述技術方案來解決上述技術問題:
本發明的第一方面提供一種彩鈴識別的方法,包括以下步驟:
將輸入的音頻信號轉換為文本;
判斷是否存在與所述文本匹配的關鍵詞;
若是,則將所述音頻信號識別為彩鈴;
若否,則將所述音頻信號輸入至彩鈴分類模型,并根據所述彩鈴分類模型的預測結果確定所述音頻信號是否為彩鈴;其中,所述彩鈴分類模型基于訓練樣本訓練得到,所述訓練樣本包括彩鈴樣本以及包括人聲的非彩鈴樣本。
較佳地,所述將所述音頻信號輸入至彩鈴分類模型,根據所述彩鈴分類模型的預測結果確定所述音頻信號是否為彩鈴,具體包括:
對所述音頻信號進行分幀處理,得到若干幀子音頻信號;
分別對各幀子音頻信號進行檢測,得到有效幀,其中,所述有效幀為包括語音區的子音頻信號;
將所述有效幀輸入至彩鈴分類模型,得到所述有效幀的預測結果;
根據所有有效幀的預測結果確定所述音頻信號是否為彩鈴。
較佳地,所述根據所有有效幀的預測結果確定所述音頻信號是否為彩鈴,具體包括:
若有效幀為彩鈴的幀數與所有有效幀的幀數之比大于預設值,則確定所述音頻信號為彩鈴,否則,確定所述音頻信號不為彩鈴。
較佳地,所述將所述有效幀輸入至彩鈴分類模型具體包括:
對所述有效幀進行加窗和傅里葉變換的預處理,得到所述有效幀的頻譜特征;
將所述有效幀的頻譜特征輸入至彩鈴分類模型。
較佳地,所述彩鈴分類模型為神經網絡模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于攜程旅游網絡技術(上海)有限公司,未經攜程旅游網絡技術(上海)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010953701.2/2.html,轉載請聲明來源鉆瓜專利網。





