[發明專利]一種中文請求文本意圖分析方法在審
| 申請號: | 202011463898.8 | 申請日: | 2020-12-11 |
| 公開(公告)號: | CN112446219A | 公開(公告)日: | 2021-03-05 |
| 發明(設計)人: | 劉光毅 | 申請(專利權)人: | 四川長虹電器股份有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/289;G06F40/242;G06N3/04 |
| 代理公司: | 四川省成都市天策商標專利事務所 51213 | 代理人: | 劉興亮 |
| 地址: | 621000 四*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 中文 請求 文本 意圖 分析 方法 | ||
1.一種中文請求文本意圖分析方法,其特征在于,包括以下步驟:
步驟1,用戶數據處理,動詞詞典構造,意圖目錄構造;
步驟2,分詞、Word2vec詞向量訓練,構造詞匯表;
步驟3,IDCNN學習訓練;
步驟4,注意力機制調整權重;
步驟5,對有表達明顯意圖的動詞關鍵詞作為判斷關鍵,加入規則輔助判斷預測結果,輸出對用戶請求的意圖判斷。
2.如權利要求1所述的一種中文請求文本意圖分析方法,其特征在于,所述步驟1中,收集MUSIC相關漢語動詞構造詞典,由意圖種類構建意圖目錄;從電視端采集用戶在MUSIC領域的請求數據,結合音樂評論、KTV評論相關網頁評論中含有表達意圖的評論,篩選后作為原始數據集,分別收集不同意圖的文本儲存于不同文件中,人工給數據集標注意圖。
3.如權利要求1所述的一種中文請求文本意圖分析方法,其特征在于,所述步驟2中,將步驟1中清洗的數據分詞后,構建相應詞匯變,通過Word2vec訓練64維的詞向量;
將數據通過分詞系統有效分成完整實體的詞匯,再由此構建大小為5000的詞匯表。
4.如權利要求1所述的一種中文請求文本意圖分析方法,其特征在于,所述步驟3中,將短文本采用詞向量表示之后,構建膨脹卷積神經網絡,輸入單元X={x1,x2,...,xt},其中每個xi(i=1,2,...,t)為詞向量,隱含層包含前向傳播層和后向傳播層。
5.如權利要求1所述的一種中文請求文本意圖分析方法,其特征在于,所述步驟4中,在IDCNN的基礎上,加入注意力機制,對卷積網絡生成的特征輸出,從通道和空間兩個維度計算其注意力attention,然后將其與輸入的特征相乘來進行特征的自適應學習。
6.如權利要求5所述的一種中文請求文本意圖分析方法,其特征在于,使用最大池化和平均池化對IDCNN中間層的輸出特征在空間唯獨上進行壓縮,得到兩個不同的背景描述:和使用由MLP組成的共享網絡對這兩個不同的空間背景描述進行計算得到調整后的特征:
最后,W0用Relu作為激活函數;
使用最大池化和平均池化得到兩個不同的特征描述:和將兩個特征描述結合,并使用卷積操作生成spatial attention map:Ms(F)
f7*7表示7×7的卷積層。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于四川長虹電器股份有限公司,未經四川長虹電器股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011463898.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:控水結構及加濕器
- 下一篇:一種面向客戶服務的企業知識庫管理方法





