[發(fā)明專利]基于金融系統(tǒng)的數(shù)字員工智能系統(tǒng)有效
| 申請?zhí)枺?/td> | 202211090442.0 | 申請日: | 2022-09-07 |
| 公開(公告)號: | CN115602165B | 公開(公告)日: | 2023-05-05 |
| 發(fā)明(設(shè)計)人: | 黃術(shù);黃琪敏;裘浩祺;魏祥 | 申請(專利權(quán))人: | 杭州優(yōu)航信息技術(shù)有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/18;G10L15/16;G10L15/20;G10L15/02;G10L15/06;G10L25/03;G10L25/24;G06F18/241;G06N3/0464 |
| 代理公司: | 深圳峰誠志合知識產(chǎn)權(quán)代理有限公司 44525 | 代理人: | 杜翠鳴 |
| 地址: | 310005 浙江省杭州市西湖*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 金融系統(tǒng) 數(shù)字 員工 智能 系統(tǒng) | ||
1.一種基于金融系統(tǒng)的數(shù)字員工智能系統(tǒng),其特征在于,包括:
語音信號采集模塊,用于獲取客戶的咨詢語音信號;
降噪模塊,用于將所述咨詢語音信號通過基于自動編碼器的信號降噪模塊以得到降噪后咨詢語音信號;
語音譜圖提取模塊,用于從所述降噪后咨詢語音信號提取對數(shù)梅爾譜圖、耳蝸譜圖和恒定Q變換譜圖;
多通道語義譜圖構(gòu)造模塊,用于將所述對數(shù)梅爾譜圖、所述耳蝸譜圖和所述恒定Q變換譜圖排列為多通道語音譜圖;
雙流編碼模塊,用于將所述多通道語音譜圖通過雙流網(wǎng)絡(luò)模型以得到分類特征圖;
自適應(yīng)校正模塊,用于基于所述分類特征圖中的所有位置的特征值集合的統(tǒng)計特征,對所述分類特征圖中各個位置的特征值進(jìn)行校正以得到校正后分類特征圖;以及
咨詢意圖識別模塊,用于將所述校正后分類特征圖通過分類器以得到分類結(jié)果,所述分類結(jié)果用于表示咨詢語音信號的意圖主題標(biāo)簽;
其中,所述雙流編碼模塊,包括:
第一卷積編碼單元,用于將所述多通道語音譜圖輸入所述雙流網(wǎng)絡(luò)模型的使用空間注意力機(jī)制的第一卷積神經(jīng)網(wǎng)絡(luò)以得到空間加強(qiáng)特征圖;
第二卷積編碼單元,用于將所述多通道語音譜圖輸入所述雙流網(wǎng)絡(luò)模型的使用通道注意力機(jī)制的第二卷積神經(jīng)網(wǎng)絡(luò)以得到通道加強(qiáng)特征圖;以及
聚合單元,用于融合所述空間加強(qiáng)特征圖和所述通道加強(qiáng)特征圖以得到所述分類特征圖;
其中,所述第一卷積編碼單元,包括:
深度卷積編碼子單元,用于將所述多通道語音譜圖輸入所述第一卷積神經(jīng)網(wǎng)絡(luò)的多層卷積層以得到第一卷積特征圖;
空間注意力子單元,用于將所述第一卷積特征圖輸入所述第一卷積神經(jīng)網(wǎng)絡(luò)的空間注意力模塊以得到空間注意力圖;以及
注意力施加子單元,用于計算所述空間注意力圖和所述第一卷積特征圖的按位置點乘以得到所述空間加強(qiáng)特征圖;
其中,所述空間注意力子單元,用于:
使用所述空間注意力模塊的卷積層對所述第一卷積特征圖進(jìn)行卷積編碼以得到空間感知特征圖;
計算所述空間感知特征圖與所述第一卷積特征圖之間的按位置點乘以得到空間注意力得分圖;以及
將所述空間注意力得分圖輸入Sigmoid激活函數(shù)以得到所述空間注意力圖;
其中,所述第二卷積編碼單元,包括:
深度卷積編碼子單元,用于將所述多通道語音譜圖輸入所述第二卷積神經(jīng)網(wǎng)絡(luò)的多層卷積層以得到第二卷積特征圖;
全局均值池化子單元,用于計算所述第二卷積特征圖的沿通道維度的各個特征矩陣的全局均值以得到通道特征向量;
通道注意力權(quán)重計算子單元,用于將所述通道特征向量輸入所述Sigmoid激活函數(shù)以得到通道注意力權(quán)重向量;以及
通道注意力施加子單元,用于以所述通道注意力權(quán)重向量中各個位置的特征值作為權(quán)重分別對所述第二卷積特征圖的沿通道維度的各個特征矩陣進(jìn)行加權(quán)以得到所述通道加強(qiáng)特征圖;
其中,所述聚合單元,用于:
使用所述聚合單元以如下公式來融合所述空間加強(qiáng)特征圖和所述通道加強(qiáng)特征圖以獲得所述分類特征圖,其中,所述公式為:
Fs=αF1+βF2
其中,F(xiàn)s為所述分類特征圖,F(xiàn)1為所述空間加強(qiáng)特征圖,F(xiàn)2為所述通道加強(qiáng)特征圖,“+”表示所述空間加強(qiáng)特征圖和所述通道加強(qiáng)特征圖相對應(yīng)位置處的元素相加,α和β為用于控制所述分類特征圖中所述空間加強(qiáng)特征圖和所述通道加強(qiáng)特征圖之間的平衡的加權(quán)參數(shù)。
2.根據(jù)權(quán)利要求1所述的基于金融系統(tǒng)的數(shù)字員工智能系統(tǒng),其特征在于,所述降噪模塊,包括:
語音信號編碼單元,用于將所述咨詢語音信號輸入所述信號降噪模塊的編碼器,其中,所述編碼器使用卷積層對所述咨詢語音信號進(jìn)行顯式空間編碼以得到語音特征;以及
語義特征解碼單元,用于將所述語義特征輸入所述信號降噪模塊的解碼器,其中,所述解碼器使用反卷積層對所述語音特征進(jìn)行反卷積處理以得到所述降噪后咨詢語音信號。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于杭州優(yōu)航信息技術(shù)有限公司,未經(jīng)杭州優(yōu)航信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211090442.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





