[發明專利]面向社區問答的問題分類方法及系統有效
| 申請號: | 202010122754.X | 申請日: | 2020-02-27 |
| 公開(公告)號: | CN111353032B | 公開(公告)日: | 2022-06-14 |
| 發明(設計)人: | 陳羽中;張衍坤 | 申請(專利權)人: | 福州大學 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/35;G06N3/08;G06N3/04 |
| 代理公司: | 福州元創專利商標代理有限公司 35100 | 代理人: | 丘鴻超;蔡學俊 |
| 地址: | 350108 福建省福州市*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 面向 社區 問答 問題 分類 方法 系統 | ||
1.一種面向社區問答的問題分類方法,其特征在于,包括以下步驟:
步驟A:采集網絡問答社區中用戶所提問題以及對應的問題類別,構建問題分類訓練集TS;
步驟B:對問題分類訓練集TS中的問題進行字符級編碼和詞語級編碼,得到問題的表征向量,以此訓練基于雙通道神經網絡的深度學習網絡模型;
步驟C:問題分類系統接受用戶提交的問題,將問題輸入到訓練好的深度學習網絡模型中,輸出模型劃分的問題所述類別;
所述步驟B具體包括以下步驟:
步驟B1:遍歷問題分類訓練集TS,TS中的每個訓練樣本表示為(q,y),其中q表示問題,y=c∈C表示問題q所屬的問題類別,C={1,2,...,L}為問題類別集合,1≤c≤L,L表示問題類別數;將問題q輸入深度學習網絡模型的字符級編碼模塊,得到問題q的字符向量序列
步驟B2:將問題q的字符向量序列輸入深度學習網絡模型的雙層Bi-LSTM網絡模塊,再輸入注意力模塊,得到問題q的表征向量
步驟B3:將問題q輸入深度學習網絡模型的詞語級編碼模塊,得到問題q的詞語級表征向量
步驟B4:將問題q的詞語級表征向量輸入到深度學習網絡模型的帶shortcut連接的卷積神經網絡中,得到問題q的表征向量
步驟B5:將問題q的表征向量與輸入全連接層進行融合,得到問題q的最終表征向量將輸入到Softmax層中,計算問題q屬于各個問題類別的概率選擇作為預測的問題類別;
步驟B6:根據目標損失函數loss,利用反向傳播方法計算深度學習網絡模型中各參數的梯度,并利用隨機梯度下降方法更新參數,以此訓練深度學習網絡模型;
步驟B7:當深度學習網絡模型的損失值迭代變化小于設定閾值或者達到最大迭代次數時,則終止深度學習網絡模型的訓練。
2.根據權利要求1所述的面向社區問答的問題分類方法,其特征在于,所述步驟B1具體包括以下步驟:
步驟B11:對問題q進行分詞處理,并去除停用詞,得到問題q的詞序列q={w1,w2,...,wk},其中wi,i=1,2,...,k為分詞及去除停用詞后的問題q中的第i個詞,k為分詞及去除停用詞后的問題q中的詞語數,其中ci,j,j=1,2,...,ni為構成wi的第j個字符,ni為wi中的字符數;
步驟B12:對問題q的詞序列q={w1,w2,...,wk}中的每個詞wi進行字符級編碼,wi的字符序列為則wi的字符向量序列為其中為ci,j的字符向量,在預訓練的字符向量矩陣中查詢得到,其中d1表示字符向量的維度,|V1|表示字符向量矩陣E1中的字符總數;則問題q的字符向量序列為
3.根據權利要求2所述的面向社區問答的問題分類方法,其特征在于,所述步驟B2具體包括以下步驟:
步驟B21:遍歷問題q的每個詞wi,將其字符向量序列輸入第一層Bi-LSTM網絡,得到wi的隱藏狀態序列取作為wi的詞向量即則問題q的詞向量序列為
步驟B22:將輸入第二層Bi-LSTM網絡,得到問題q的隱藏狀態序列h=[h1,h2,...,hi,...,hk],其中hi為的隱藏狀態;
步驟B23:將問題q的隱藏狀態序列h=[h1,h2,...,hi,...,hk]輸入到注意力層,輸出問題q的表征向量
其中,Wa表示權重矩陣。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于福州大學,未經福州大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010122754.X/1.html,轉載請聲明來源鉆瓜專利網。





