[發(fā)明專利]面向開(kāi)源社區(qū)的跨項(xiàng)目issue參與者推薦框架在審
| 申請(qǐng)?zhí)枺?/td> | 202111390863.0 | 申請(qǐng)日: | 2021-11-23 |
| 公開(kāi)(公告)號(hào): | CN114064990A | 公開(kāi)(公告)日: | 2022-02-18 |
| 發(fā)明(設(shè)計(jì))人: | 汪亮;江會(huì)煜;陶先平 | 申請(qǐng)(專利權(quán))人: | 南京大學(xué) |
| 主分類號(hào): | G06F16/9035 | 分類號(hào): | G06F16/9035;G06F40/30;G06F40/216;G06K9/62;G06F16/901 |
| 代理公司: | 南京鐘山專利代理有限公司 32252 | 代理人: | 王磊 |
| 地址: | 210023 江蘇*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 面向 社區(qū) 項(xiàng)目 issue 參與者 推薦 框架 | ||
1.面向開(kāi)源社區(qū)的跨項(xiàng)目issue參與者推薦框架,其特征在于,包括數(shù)據(jù)采集與文本預(yù)處理模塊、關(guān)聯(lián)文本語(yǔ)義嵌入模塊、開(kāi)源社區(qū)實(shí)體結(jié)構(gòu)嵌入模塊和推薦結(jié)果排序模塊,
所述數(shù)據(jù)采集與文本預(yù)處理模塊:用于從開(kāi)源社區(qū)中獲取信息并以一定格式加以處理,包括,去除質(zhì)量差的issue和issue中的干擾部分,對(duì)issue文本進(jìn)行詞干提取、詞形還原并去除停止詞以得到issue文本集,分別提取每個(gè)issue對(duì)其他issue的引用關(guān)系以構(gòu)建issue關(guān)系集;
所述關(guān)聯(lián)文本語(yǔ)義嵌入模塊:定義訓(xùn)練目標(biāo)函數(shù)并利用issue文本集和issue關(guān)系集訓(xùn)練語(yǔ)義嵌入模型,通過(guò)語(yǔ)義嵌入模型獲取待推薦issue的文本語(yǔ)義嵌入向量,并通過(guò)其與issue文本集中issue文本語(yǔ)義嵌入向量的距離找出與待推薦issue語(yǔ)義相似的issue集合;
所述開(kāi)源社區(qū)實(shí)體結(jié)構(gòu)嵌入模塊:構(gòu)建整個(gè)開(kāi)源社區(qū)中開(kāi)發(fā)者、倉(cāng)庫(kù)、issue三種結(jié)點(diǎn)間交互關(guān)系的異質(zhì)圖,為跨項(xiàng)目的推薦任務(wù)設(shè)計(jì)issue引用關(guān)系增強(qiáng)的元路徑,以元路徑對(duì)異質(zhì)圖進(jìn)行采樣并采用圖嵌入方法訓(xùn)練得到每個(gè)結(jié)點(diǎn)的結(jié)構(gòu)嵌入向量以構(gòu)建結(jié)構(gòu)關(guān)系向量集合;
所述推薦結(jié)果排序模塊:從結(jié)構(gòu)關(guān)系向量集合中找出issue集合和待推薦issue所屬倉(cāng)庫(kù)的結(jié)構(gòu)關(guān)系向量,并計(jì)算其與開(kāi)發(fā)者結(jié)點(diǎn)的向量距離以得到有序的開(kāi)發(fā)者推薦結(jié)果。
2.如權(quán)利要求1所述的面向開(kāi)源社區(qū)的跨項(xiàng)目issue參與者推薦框架,其特征在于,所述數(shù)據(jù)采集與文本預(yù)處理模塊的具體處理過(guò)程包括:
S1.1、從開(kāi)源社區(qū)中獲取需要的開(kāi)源倉(cāng)庫(kù)集合R,對(duì)R中的每個(gè)倉(cāng)庫(kù)r,獲取其issue集合Ir,每個(gè)issue包含標(biāo)題、描述和評(píng)論的所有文本,所有倉(cāng)庫(kù)的issue構(gòu)成集合I=∪r∈RIr;
S1.2、從集合I中去除標(biāo)題單詞數(shù)目少于m或描述字符數(shù)目少于n的issue,并去除issue中引用他人部分的文本和代碼,利用傳統(tǒng)文本預(yù)處理方法進(jìn)行詞干提取、詞形還原、去除停止詞得到issue預(yù)處理后的文本集;
S1.3、抽取出所有issue的參與者構(gòu)成參與者集合D,再根據(jù)所有開(kāi)發(fā)者參與issue的關(guān)系構(gòu)成參與關(guān)系集合J;
S1.4、根據(jù)開(kāi)源社區(qū)倉(cāng)庫(kù)信息抽取維護(hù)關(guān)系d,r構(gòu)成維護(hù)關(guān)系集合M,d,r表示開(kāi)發(fā)者d維護(hù)倉(cāng)庫(kù)r,d∈D,r∈R;
S1.5、提取issu之間的所有引用關(guān)系構(gòu)成引用關(guān)系集合Q,其中im,in∈Q(im∈I,in∈I,im≠in)表示issue im中包含對(duì)issue in的引用鏈接;
S1.6、構(gòu)建issue屬于倉(cāng)庫(kù)的隸屬關(guān)系集合B,其中im,rn∈B(im∈I,rn∈R)表示issueim屬于倉(cāng)庫(kù)rn。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京大學(xué),未經(jīng)南京大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111390863.0/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 一種網(wǎng)絡(luò)社區(qū)的社區(qū)信息發(fā)布方法、裝置及系統(tǒng)
- 一種挖掘社區(qū)用戶的方法及裝置
- 社區(qū)應(yīng)用消息處理方法和裝置
- 社交網(wǎng)絡(luò)社區(qū)影響力評(píng)估算法
- 一種基于物聯(lián)網(wǎng)的智慧社區(qū)管理系統(tǒng)
- 一種一體化社區(qū)服務(wù)系統(tǒng)
- 社區(qū)配送路徑生成方法和裝置
- 社區(qū)物流交互系統(tǒng)
- 一種基于大數(shù)據(jù)的社區(qū)活動(dòng)推薦方法及裝置
- 一種用于智慧社區(qū)的服務(wù)信息的傳輸方法及系統(tǒng)
- 一種項(xiàng)目信息處理方法及系統(tǒng)
- 軟件項(xiàng)目管理方法、終端及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種基于微信公眾號(hào)的線上項(xiàng)目申請(qǐng)審批的方法及系統(tǒng)
- 一種項(xiàng)目管理系統(tǒng)及方法
- 一種建筑項(xiàng)目綜合管理系統(tǒng)
- 一種項(xiàng)目管理方法、裝置及設(shè)備
- 項(xiàng)目管理方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 項(xiàng)目管理系統(tǒng)、方法、計(jì)算機(jī)設(shè)備和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種電力項(xiàng)目業(yè)務(wù)中臺(tái)及其微服務(wù)系統(tǒng)
- 一種基于標(biāo)簽確定項(xiàng)目成員的方法、裝置以及存儲(chǔ)介質(zhì)
- 一種支持有向有環(huán)圖的微調(diào)度方法
- 基于GPGPU體系結(jié)構(gòu)的協(xié)同調(diào)度方法及系統(tǒng)
- 一種MEMS器件及制備方法、電子裝置
- 一種軟件代碼片段歷史追溯的方法
- 開(kāi)源軟件開(kāi)發(fā)中Issue解決時(shí)間的預(yù)測(cè)方法及系統(tǒng)
- 一種基于JIRA系統(tǒng)的issue狀態(tài)自動(dòng)轉(zhuǎn)換方法、裝置和介質(zhì)
- 帶功能詳情圖形用戶界面的顯示屏幕面板
- 基于GitHub自動(dòng)化檢測(cè)Maven項(xiàng)目中依賴沖突問(wèn)題的方法
- 一種針對(duì)CPython和PyPy的解釋器缺陷自動(dòng)分類方法
- 一種追蹤引入缺陷提交的方法、系統(tǒng)及設(shè)備





