[發明專利]一種利用非對稱的多面排序網絡學習解決社區問答任務的方法在審
| 申請號: | 201711227321.5 | 申請日: | 2017-11-29 |
| 公開(公告)號: | CN108153816A | 公開(公告)日: | 2018-06-12 |
| 發明(設計)人: | 趙洲;孟令濤;林志杰;蔡登;何曉飛;莊越挺 | 申請(專利權)人: | 浙江大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 杭州求是專利事務所有限公司 33200 | 代理人: | 鄭海峰 |
| 地址: | 310058 浙江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 多面 排序網絡 非對稱 問題答案 排序標準 學習 答案 語義 答案數據 傳統的 組用戶 構建 網站 排序 社區 網絡 預測 | ||
1.一種利用非對稱的多面排序網絡學習解決社區問答任務的方法,其特征在于包括如下步驟:
1)針對于一組社交網絡用戶及其提出的問題與相關答案,構建包含用戶、問題與答案之間相互關系的異質的非對稱社區問答網絡;
2.1)對于步驟1)形成的社區問答網絡,利用單詞映射網絡及LSTM網絡形成問題答案的映射,再結合用戶映射獲取反映用戶問答語義映射相關性的損失值;
2.2)對于步驟1)形成的社區問答網絡,利用其中含有的用戶關系,與用戶映射矩陣相結合,得到反映用戶之間相互關系的損失項值;
2.3)利用步驟2.1)獲得的反映用戶問答語義映射相關性的損失值與步驟2.2)獲得的反映用戶之間相互關系的損失項值,得到最終的損失函數及目標函數;
3)經過訓練,得到最終的多面排序標準函數,根據該函數可以對于任意問題及用戶提出的答案進行排序,將更適合問題的答案排在前列。
2.根據權利要求1所述利用非對稱的多面排序網絡學習解決社區問答任務的方法,其特征在于所述的步驟2.1)具體為:
對于所給出的問題、答案,利用如下方法獲得每個問題與答案的映射表達:首先利用預訓練好的單詞映射方法獲得問題答案中單詞的對應映射,對于問題xi的第t個單詞,得到其映射為xit;之后將問題的單詞映射序列{xi1,...,xin}作為LSTM的輸入,將所有問題的單詞全部輸入之后,進行訓練,將最后一層的輸出作為問題的語義表達,記為qi;對于答案yi,將答案中的每一句話的所有單詞的單詞映射序列{yi1,...,yin}輸入到LSTM網絡中,將每一句話的最后一層的輸出作為該句話的語義表達,之后在該答案的所有句子的語義表達輸出上面增加一最大池化層,將最大池化層的輸出作為該答案的語義表達,記為ai;
通過隨機初始化得到用戶的映射矩陣U={u1,u2,...,ul},根據步驟1)獲得的異質的非對稱社區問答網絡,獲得關于問題及相關答案和用戶的限制集合R={(i,j,k,o,p)},該集合中的每一條數據(i,j,k,o,p)代表的含義為“針對于問題i而言,由用戶k提出的答案j可以比由用戶p提出的答案o獲得更多的支持,更加符合問題的要求;”
針對于R={(i,j,k,o,p)}中的每一條數據,按照如下公式構建反映用戶問答語義映射相關性的損失函數Lr:
其中,c代表提前定義好的權衡最大距離值的參數,0為與進行最大值比較防止結果小于0的限定值;代表高質量答案對應的問答對的多面排序函數,代表低質量答案對應的問答對的多面排序函數,與的計算公式如下:
其中,qi為問題i的對應映射表達,ak為答案k的對應映射表達,uj為用戶j的對應映射表達,ap為答案p的對應映射表達,uo為用戶o的對應映射表達,M∈Rd*d為用來計算問題與答案映射之間的語義關聯程度的排序度量矩陣。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大學,未經浙江大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711227321.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:面向大數據的指標分類方法
- 下一篇:一種智能網頁數據采集方法





