[發(fā)明專利]回答者推薦模型的訓(xùn)練方法、推薦方法及電子設(shè)備在審
| 申請?zhí)枺?/td> | 202010767815.8 | 申請日: | 2020-08-03 |
| 公開(公告)號: | CN111881282A | 公開(公告)日: | 2020-11-03 |
| 發(fā)明(設(shè)計(jì))人: | 陳卓;袁璽明;杜軍威;葛艷;李涵;姜偉豪;魏銳 | 申請(專利權(quán))人: | 青島科技大學(xué) |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06N20/20 |
| 代理公司: | 北京力致專利代理事務(wù)所(特殊普通合伙) 11900 | 代理人: | 周厚民 |
| 地址: | 266061 山*** | 國省代碼: | 山東;37 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 回答者 推薦 模型 訓(xùn)練 方法 電子設(shè)備 | ||
本發(fā)明數(shù)據(jù)挖掘技術(shù)領(lǐng)域,具體涉及回答者推薦模型的訓(xùn)練方法、推薦方法及電子設(shè)備。訓(xùn)練方法包括獲取樣本評分矩陣以及未獲得財(cái)富值的數(shù)據(jù)集;未獲得財(cái)富值的數(shù)據(jù)集包括回答者特征以及問題特征;利用未獲得財(cái)富值的數(shù)據(jù)集對回答者推薦模型中的DeepFM模塊進(jìn)行訓(xùn)練,以填充樣本評分矩陣;將填充后的樣本評分矩陣輸入回答者推薦模型中的矩陣分解模塊分解樣本評分矩陣,得到回答者矩陣以及問題矩陣;基于回答者矩陣與問題矩陣,預(yù)測問題對應(yīng)的回答者;利用評分預(yù)測值與問題對應(yīng)的目標(biāo)評分值,對DeepFM模塊以及矩陣分解模塊的參數(shù)進(jìn)行更新,確定回答者推薦模型。該回答者推薦模型中DeepFM模塊與矩陣分解模塊組成了一個(gè)強(qiáng)學(xué)習(xí)器,提高了預(yù)測結(jié)果的準(zhǔn)確性。
技術(shù)領(lǐng)域
本發(fā)明涉及數(shù)據(jù)挖掘技術(shù)領(lǐng)域,具體涉及回答者推薦模型的訓(xùn)練方法、推薦方法及電子設(shè)備。
背景技術(shù)
隨著網(wǎng)絡(luò)的高速發(fā)展,書本的知識(shí)難以滿足人們?nèi)找嬖鲩L的知識(shí)需求,問答社區(qū)成為了人們分享經(jīng)驗(yàn)與獲取知識(shí)的新平臺(tái)。以海川化工論壇為例,其是國內(nèi)最大的專業(yè)化工問答社區(qū)和化工類交流的專業(yè)平臺(tái),日均訪客10萬其中95%以上的訪客均為從業(yè)人員,成員來自于國內(nèi)各大設(shè)計(jì)院、生產(chǎn)制造企業(yè)、銷售單位及各大高校。在海川化工論壇近十年的數(shù)據(jù)中,有超過400萬用戶和超過100萬個(gè)問題,其中近三分之一的問題沒有獲得明確的答案,同時(shí)論壇每天都會(huì)產(chǎn)生大量的問題,需要有回答能力的用戶來解決。一方面是有許多問題沒有被有能力的回答者發(fā)現(xiàn),導(dǎo)致問題長時(shí)間無人問津,社區(qū)內(nèi)出現(xiàn)了大量無人回答的問題。另一方面是有能力回答問題的用戶沒有發(fā)現(xiàn)與自己專業(yè)、能力相匹配的問題,海量不相關(guān)的問題,導(dǎo)致用戶回答問題的效率變低,用戶對社區(qū)的興趣度下降。
為了解決上述問題,推薦成為了海川化工論壇的關(guān)鍵技術(shù),推薦的目的是根據(jù)回答者的能力為用戶提供力所能及解決的問題。目前推薦系統(tǒng)在應(yīng)用到海川化工論壇時(shí),主要面臨兩大技術(shù)挑戰(zhàn):(1)稀疏性:由于用戶往往只與少數(shù)項(xiàng)目進(jìn)行交互,因此很難訓(xùn)練出一個(gè)準(zhǔn)確的推薦模型,特別是對于交互次數(shù)較少的用戶或項(xiàng)目;(2)冷啟動(dòng):在海川化工論壇,超過400萬用戶中,僅有不到30萬的用戶參與回答問題,絕大多數(shù)用戶沒有用戶行為,處理這些問題或預(yù)測用戶對這些項(xiàng)目的偏好是具有挑戰(zhàn)性的,這就是所謂的“冷啟動(dòng)”問題。因此,上述兩大技術(shù)挑戰(zhàn)導(dǎo)致現(xiàn)有的推薦方法在為新問題預(yù)測回答者的應(yīng)用中,預(yù)測準(zhǔn)確性偏低。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明實(shí)施例提供了一種回答者推薦模型的訓(xùn)練方法、推薦方法及電子設(shè)備,以解決現(xiàn)有推薦方法的預(yù)測準(zhǔn)確性偏低的問題。
根據(jù)第一方面,本發(fā)明實(shí)施例提供了一種回答者推薦模型的訓(xùn)練方法,包括:
獲取樣本評分矩陣以及未獲得財(cái)富值的數(shù)據(jù)集;其中,所述未獲得財(cái)富值的數(shù)據(jù)集包括回答者特征以及問題特征;
利用所述未獲得財(cái)富值的數(shù)據(jù)集對回答者推薦模型中的DeepFM模塊進(jìn)行訓(xùn)練,以填充所述樣本評分矩陣;
將填充后的所述樣本評分矩陣輸入所述回答者推薦模型中的矩陣分解模塊分解所述樣本評分矩陣,得到回答者矩陣以及問題矩陣;
基于所述回答者矩陣與所述問題矩陣,預(yù)測所述問題對應(yīng)的回答者;
利用所述評分預(yù)測值與所述問題對應(yīng)的目標(biāo)評分值,對所述DeepFM模塊以及所述矩陣分解模塊的參數(shù)進(jìn)行更新,確定所述回答者推薦模型。
本發(fā)明實(shí)施例提供的回答者推薦模型的訓(xùn)練方法,利用DeepFM模塊對將一些參與回答但未獲得財(cái)富值的回答進(jìn)行財(cái)富值填充,使得填充后的樣本評分矩陣更加稠密同時(shí)也解決了冷啟動(dòng)問題,利用矩陣分解模塊提高了預(yù)測的準(zhǔn)確性。因此,訓(xùn)練得到的回答者推薦模型中DeepFM模塊與矩陣分解模塊組成了一個(gè)強(qiáng)學(xué)習(xí)器,提高了預(yù)測結(jié)果的準(zhǔn)確性。
結(jié)合第一方面,在第一方面第一實(shí)施方式中,所述基于所述回答者矩陣以及所述問題矩陣,預(yù)測所述問題對應(yīng)的回答者,包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于青島科技大學(xué),未經(jīng)青島科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010767815.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





