[發明專利]基于事件提取和權責清單的政務熱線工單分撥方法在審
| 申請號: | 202111025600.X | 申請日: | 2021-09-02 |
| 公開(公告)號: | CN113657091A | 公開(公告)日: | 2021-11-16 |
| 發明(設計)人: | 陳鋼;佘祥榮;陳健鵬 | 申請(專利權)人: | 長三角信息智能創新研究院 |
| 主分類號: | G06F40/205 | 分類號: | G06F40/205;G06F40/284;G06N3/04;G06N3/08;G06Q50/26 |
| 代理公司: | 北京潤平知識產權代理有限公司 11283 | 代理人: | 董杰 |
| 地址: | 241000 安*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 事件 提取 權責 清單 政務 熱線 分撥 方法 | ||
1.一種基于事件提取和權責清單的政務熱線工單分撥方法,其特征在于,包括:
步驟1、構建語義編碼層;
步驟2、構建事件提取層;
步驟3、構建權責清單嵌入層;
步驟4、分撥工單。
2.根據權利要求1所述的基于事件提取和權責清單的政務熱線工單分撥方法,其特征在于,步驟1包括:
步驟1.1、使用RoBERTa預訓練語言模型對工單文本內容進行語義編碼,在文本輸入轉換為token序列后,將該序列表達為向量形式,由token嵌入、分句嵌入和位置嵌入三部分組成,并送入由12層Transformer編碼器模塊堆疊成的編碼層中提取語義特征;
步驟1.2、在經過RoBERTa模型編碼后,將12層Transformer編碼器中的任意某些層的編碼輸出進行拼接融合來得到上下文嵌入矩陣,并輸入到后續層中來獲得最佳效果;
步驟1.3、在獲得具有上下文特征信息的語義表征向量后,將融合后的編碼輸入到事件提取層中。
3.根據權利要求1所述的基于事件提取和權責清單的政務熱線工單分撥方法,其特征在于,步驟2包括:
步驟2.1、通過CNN提取詞級別特征;
步驟2.2、利用BiGRU網絡來獲取文本上下文語義信息得到句子級別特征;
步驟2.3、運用Self-Attetion后拼接句子級別特征和詞級別特征;
步驟2.4、利用條件隨機場優化事件提取網絡。
4.根據權利要求3所述的基于事件提取和權責清單的政務熱線工單分撥方法,其特征在于,步驟2.1包括:
步驟2.1.1、將Roberta輸出的工單文本編碼向量作為CNN網絡的輸入序列并提取對應的局部特征,以特征向量的形式輸出整句文本的語義特征;
步驟2.1.2、完成卷積操作后,得到的每個特征向量都被送到池化層以生成潛在的局部特征,采用最大池化策略對卷積層輸出結果進行池化,捕獲卷積之后的最重要特征,以將一個變長句子處理為固定長度;
步驟2.1.3、使用卷積核掃描句子中的每個單詞,得到整個句子的特征向量;
步驟2.1.4、通過卷積集合來獲取不同尺度上的文本特征,重復卷積過程,拼接各個卷積核的結果,得到整個政務服務熱線文本句子的特征向量。
5.根據權利要求3所述的基于事件提取和權責清單的政務熱線工單分撥方法,其特征在于,步驟2.2包括:
步驟2.2.1、將語義表征向量L中的元素分別輸入前向GRU和反向GRU得到前向隱藏狀態和反向隱藏狀態
步驟2.2.2、拼接前向和反向隱藏狀態得到BiGRU的隱藏狀態
6.根據權利要求3所述的基于事件提取和權責清單的政務熱線工單分撥方法,其特征在于,步驟2.3包括:
步驟2.3.1、對輸入的每一個部分進行編碼后形成語義編碼Iembedding;
步驟2.3.2、建立參數矩陣WQ、WK和WV,將語義編碼Iembedding線性映射到特征空間中,形成Q、K、V三個向量;
步驟2.3.3、針對Q和K進行相似度計算,得到計算注意力權重,并對得到的權值進行歸一化操作,最后將權重與Value進行加權求和得到最終的注意力得分Vout。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于長三角信息智能創新研究院,未經長三角信息智能創新研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111025600.X/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種籃球技巧輔助訓練系統
- 下一篇:一種能長期儲存面粉的面粉罐





