[發明專利]開源社區PR評審者可解釋推薦模型在審
| 申請號: | 201910143846.3 | 申請日: | 2019-02-27 |
| 公開(公告)號: | CN109885776A | 公開(公告)日: | 2019-06-14 |
| 發明(設計)人: | 蔣尚華;郁松 | 申請(專利權)人: | 中南大學 |
| 主分類號: | G06F16/9536 | 分類號: | G06F16/9536;G06F16/33;G06K9/62 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 410083 湖南*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 透明度 算法融合 用戶驅動 數據源 整合 算法 社區 預測 決策 開發 研究 | ||
對于開源社區Pull Request(PR)Reviewer推薦模型,傳統上著重于通過開發新的算法或通過整合新的數據源來提高推薦的預測準確性。本發明主要集中精力研究推薦模型領域的一個未知的方面:解釋和透明度。推薦模型需要進一步提高透明度,讓用戶更加信任和滿意。解釋對于用戶驅動的推薦算法融合的模型來說尤其重要,模型中要以有意義的方式解釋推薦來源,用戶根據特定方面以及綜合排名清單,對被推薦人排名高低的原因有深入的了解,做出最優的決策。
技術領域
本發明為開源社區PR評審者可解釋推薦模型,屬于數據挖掘與機器學習和大數據可視化領域。
背景技術
對于開源社區PullRequest(PR)Reviewer推薦,傳統上著重于通過開發新的算法或通過整合新的數據源來提高推薦的預測準確性。然而,一些研究表明,準確性并不總是與更好的用戶體驗相關聯,向用戶有效解釋其推薦的能力是推薦模型的另一個重要方面。一個推薦模型能夠以使其推理更加透明的方式向用戶解釋其推薦算法,可以顯著地促進用戶對推薦模型的信任和推薦結果的滿意。一個很好的可解釋推薦模型是準確地說明推薦背后的原因,并允許用戶正確區分合理的建議和沒有充分合理的選擇。可以說,解釋的最重要的貢獻并不是說服用戶采用推薦,而是讓他們做出更加明確和有效的決定。近年來,研究人員越來越意識到推薦的有效性超出了推薦的準確性。因此,對這些人為因素的研究已經引起了越來越多的興趣,例如將交互式可視化技術與推薦技術相結合,以支持推薦過程的透明度和可控性??梢暬靡曈X表示來促進人類的感知,而交互則強調用戶通過與發明的對話來參與到推薦的過程。
發明內容
本發明為開源社區PR評審者可解釋推薦模型,該模型具體流程如下:
①當貢獻者(用戶)提交新的PR時,推薦算法首先分析歷史數據,并找到曾經發表過評論的Reviewer。這些Reviewer成為候選推薦人選。
②從歷史數據中提取每個Reviewer以前的評論和相應的PR。
③從先前的評論和PR中提取屬性值。
④根據該Reviewer評論過的PR屬性值計算Reviewer的評分。
⑤我們根據評分對Reviewer進行排序,找到評分靠前的Reviewer,并生成一個推薦列表。
⑥使用可視化交互式圖形展示推薦算法,提高推薦模型的透明度。使用戶對推薦結果排名深入了解,做最優的決策。
具體實施方式
為使本發明的目的、內容和優點更加清楚,下面結合附圖對本發明具體實施步驟作進一步詳細的說明。
本發明構建了開源社區PR評審者可解釋推薦模型,將交互式可視化技術與推薦技術相結合,以支持推薦模型的可解釋性。具體而言,本發明包含以下步驟:
Step1:基于PR文本相似的推薦相似度計算
文本信息經常在開發人員推薦的bug解決方案中使用。當用戶提交PR時,他們會用標題來簡要介紹他們所做的代碼更改。語義信息在Reviewer推薦中起重要作用。類似的PR通常以類似的方式描述,并且Reviewer可以在類似的PR中發表評論。我們使用PR的“title”和“body”來衡量拉請求之間的文本相似度。對于PR的文本,我們做分詞,刪除停用詞和詞干。所有剩余的單詞構成詞匯。我們使用向量空間模型來表示每個PR作為加權向量。矢量的長度是詞匯表中單詞的數量。向量中的每個元素都是一個單詞,值表示該單詞出現在請求標題中的次數。對于PR,其文本向量表示為。對于一個新的PR,我們計算了文本相似度如下所示:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中南大學,未經中南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910143846.3/2.html,轉載請聲明來源鉆瓜專利網。





