[發明專利]一種金融設備智能語音交互方法在審
| 申請號: | 202111283365.6 | 申請日: | 2021-11-01 |
| 公開(公告)號: | CN113963699A | 公開(公告)日: | 2022-01-21 |
| 發明(設計)人: | 田立剛;張云峰;張海華;魏巍;楊孟超 | 申請(專利權)人: | 恒銀金融科技股份有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L21/02 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 300308 天津市濱海新*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 金融設備 智能 語音 交互 方法 | ||
本發明公開了一種金融設備智能語音交互方法,包括如下步驟:信號的采集和分離:對音頻信號進行采集,并采用分離算法對音頻信號進行分離,分離為語音信號和噪聲信號;語音信號的合成:對語音信號進行語音識別,進行語義理解,找出最佳答案文本,將答案文本合成為回答語音信號;根據公式1確定播放音頻信號:其中,f(n)是播放音頻信號,s3(n)是預估用戶聽到的聲音信號,除振幅外,其它參數與回答語音信號均相同,d1(n)是噪聲信號,n是對音頻信號進行離散分析的采樣頻率;確定播放聲音響度為基礎聲音響度與響度衰減量之和,根據播放聲音響度對設備進行設置,實現音量大小調節。
技術領域
本發明涉及金融自助終端技術領域,尤其涉及一種金融設備智能語音交互方法。
背景技術
智能語音交互是基于語音輸入的新一代交互模式,通過說話就可以得到反饋結果。語音交互最大的問題是不夠精準。首先是受環境的影響,導致語音識別的準確率較低;再者就是表達一個意圖的說法千變萬化,更本無法覆蓋全;最后就是語音交互是一個開放域的事情,需要處理很多意外的情況。這里還沒有考慮有些場景不適合語音交互,比如會議場景,家人睡覺的時候等。
隨著金融自助設備和客服機器人的廣泛應用,現有設備在交互過程中音量恒定,在復雜環境中,環境聲音會影響使用者收聽效果,這些問題都一定程度上影響了客戶體驗的滿意度。
發明內容
本發明的目的是針對現有技術中播放聲音恒定的技術缺陷,而提供一種金融設備智能語音交互方法,在嘈雜環境中,使用者位置不同,設備自動調節設備播放音量大小,提高客戶在智能設備語音交換過程中的滿意度。
為實現本發明的目的所采用的技術方案是:
一種金融設備智能語音交互方法,其特征在于,包括如下步驟:
(1)播放音頻信號的獲取:
信號的采集和分離:對音頻信號進行采集,并采用分離算法對音頻信號進行分離,分離為語音信號和噪聲信號;
語音信號的合成:對語音信號進行語音識別,進行語義理解,找出最佳答案文本,將答案文本合成為回答語音信號;
根據公式1確定播放音頻信號,;
公式1 卷積公式
其中,f(n)是播放音頻信號,s3(n)是預估用戶聽到的聲音信號,除振幅外,其它參數與回答語音信號均相同,d1(n)是噪聲信號,n 是對音頻信號進行離散分析的采樣頻率,m取值為0-n,且為整數;
根據噪聲信號d1(n)和預估用戶聽到的信號s3(n),通過反卷積得到播放音頻信號,通過疊加噪聲信號,起到降噪功能;
(2)播放聲音響度的獲取
確定播放聲音響度為基礎聲音響度與響度衰減量之和;
(3)通過播放音頻信號確定設備播放的信息內容,通過播放聲音響度確定設備播放的音量大小,實現智能語音交互。
作為優選的,采用ICA盲源分離算法,對音頻信號進行分離。
作為優選的,喇叭到用戶的距離r的確定步驟如下:
通過紅外傳感器,判斷設備前方是否為活體,若為活體,通過超聲波傳感器,測量用戶與設備間的距離;
通過麥克風陣列進行音頻信號采集,得到用戶與設備的相對角度;
根據超聲波傳感器到用戶的距離,用戶與設備的相對角度,以及超聲波傳感器、麥克風陣列、喇叭之間的相對距離,得到喇叭到用戶的距離r。
作為優選的,設備在被喚醒后,開始音頻信號采集;對音頻信號進行分幀處理,當停頓時間超過設定時間閾值,判為停頓,進行音頻信號分離;喚醒方式包括喚醒詞喚醒或紅外線觸發喚醒。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于恒銀金融科技股份有限公司,未經恒銀金融科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111283365.6/2.html,轉載請聲明來源鉆瓜專利網。





