[發明專利]一種基于混合分類技術的大眾貢獻審閱自動標注方法有效
| 申請號: | 201710484791.3 | 申請日: | 2017-06-23 |
| 公開(公告)號: | CN107291902B | 公開(公告)日: | 2020-05-08 |
| 發明(設計)人: | 余躍;李志星;尹剛;王濤;王懷民;范強;李立 | 申請(專利權)人: | 中國人民解放軍國防科學技術大學 |
| 主分類號: | G06F16/951 | 分類號: | G06F16/951;G06F11/36;G06F8/71;G06F8/30 |
| 代理公司: | 北京中濟緯天專利代理有限公司 11429 | 代理人: | 陸薇薇 |
| 地址: | 410073 湖*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 混合 分類 技術 大眾 貢獻 審閱 自動 標注 方法 | ||
本發明公開了一種基于混合分類技術的大眾貢獻審閱自動標注方法,其涉及軟件協同開發領域。該方法包括:首先對GitHub平臺數據進行采集,所收集的數據主要包括大眾合并請求和其他開發者對這些大眾合并請求的審閱評論;然后選取GitHub經典的項目進行人工分析,結合領域相關研究定義完善的類別體系;然后隨機采樣一部分pull?request和其對應的所有審閱評論,利用在線標記平臺通過多人協同的方式進行人工標注;最后利用人工標記的數據集訓練基于混合分類技術的標注模型,再利用訓練所得模型對未標記審閱評論進行自動化標注。本發明能夠提升人工代碼審查的自動化水平,降低人工成本,提高大眾貢獻匯聚效率。
技術領域
本發明涉及軟件協同開發領域,尤其涉及一種基于混合分類技術的大眾貢獻審閱自動標注方法。
背景技術
開源軟件技術經過數十年的蓬勃發展,已經在全球性軟件工程領域占據了主導地位,其應用范圍已經覆蓋了操作系統、云計算、物聯網、大數據等互聯網時代所有的關鍵領域。開源軟件極大地加速了企業的創新速度、降低了運維成本、縮短了新產品的上市時間。開源軟件技術已成為軟件持續創新的重要動力。
隨著Web 2.0的興起,開源社區逐漸地吸納了一些社交網絡的相關技術,開源軟件創作活動的開放性與協作性進一步加強,逐漸形成了基于大眾參與的社交化編程模式(Social Coding)。在社交化的開源社區中(如Github、Trustie),所有參與者都處于一個完全開放的開發環境,參與者們互相之間能及時地了解到其他人的動態,社區內任何一個公開項目的發展軌跡對所有開發者都是可見的。GitHub社區從2008年上線,其用戶數每年以指數級增長。截止到2016年4月,GitHub托管了超過3500萬個開源軟件代碼庫,吸引了超過1400萬個軟件開發者。無論是項目數量還是參與人數,GitHub都遠遠超過了傳統的開源社區,甚至傳統社區的總和。大規模的用戶和外圍貢獻者成為了開源生態的新興主體,展現出了前所未有的生產力。開源運動進入到了前所未有的火熱時期,大眾化協同開發已是開源軟件創新的源動力。
在軟件協同開發方面,尤其是代碼管理方面,版本控制系統無疑起到了至關重要的作用。以Git為代表的新一代分布式版本控制系統一經問世就被廣泛地應用,這些工具實現了真正意義上的分布式協同開發,提高了開發效率。基于Git,GitHub開創了一種全新的圍繞合并請求(即Pull-Request)的分布式協同開發模式。這種全新的軟件協同開發模型大大降低了外圍開發者進入項目的門檻,任何開發者都可以自由地向任何一個感興趣的軟件項目貢獻代碼,因此Pull-request在GitHub社區得到了廣泛的應用。自2010年Pull-request開發技術被提出后,短短六年時間內GitHub社區已經產生了6600多萬的Pull-request,并且近些年的增長趨勢越來越迅猛,可以看出Pull-based開發模式在協同開發社區中被廣泛使用。
GitHub社區在Pull-based的開發模式下集成了輕量級的代碼審閱流程。在GitHub上,基于Pull-request的貢獻具體過程如圖1所示。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍國防科學技術大學,未經中國人民解放軍國防科學技術大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710484791.3/2.html,轉載請聲明來源鉆瓜專利網。





