[發明專利]一種新增軟件項目的軟件工作量預測方法有效
| 申請號: | 201110083894.1 | 申請日: | 2011-04-02 |
| 公開(公告)號: | CN102147727A | 公開(公告)日: | 2011-08-10 |
| 發明(設計)人: | 張文;楊葉;王青 | 申請(專利權)人: | 中國科學院軟件研究所 |
| 主分類號: | G06F9/44 | 分類號: | G06F9/44 |
| 代理公司: | 北京君尚知識產權代理事務所(普通合伙) 11200 | 代理人: | 馮藝東 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 新增 軟件 項目 工作量 預測 方法 | ||
技術領域
本發明涉及一種應用于計算機軟件工作量預測的方法,特別是在歷史項目屬性數據部分缺失情況下的軟件工作量預測方法,屬于計算機軟件開發技術領域。
背景技術
軟件成本估算是對軟件項目成本屬性的預測,由于軟件開發成本中絕大部分是人力成本,軟件成本估算通常指對工作量(人力成本)的估算。軟件工作量估算對軟件項目的重要性體現在:是分析軟件項目可行性、制定軟件項目預算、以及軟件項目涉眾進行協商的基礎,是權衡軟件開發策略重要依據,也是改進軟件過程并提高生產率重要依據。軟件工作量估算是軟件開發中最常見的,也是不可避免的問題,如果沒有得到恰當的處理,將直接導致軟件項目預算超支而引起開發進度、質量和交付等方面的風險乃至軟件項目失敗。
不確定性是軟件成本估算的一項本質屬性,并且現有方法沒有提供如何進行正確的估算,特別是不能正確地處理成本估算的不確定性。在軟件項目早期,軟件項目的成本與進度有著很高的不確定性,很多項目之所以失敗就是因為忽視這些不確定性的存在。軟件成本估算的不確定性通常引發或加重了一系列具體的問題,如:難以在項目早期進行估算、難以評估成本風險、估算結果難以被客戶接受、估算模型應用范圍狹窄等。
目前,在軟件成本估算領域,越來越多的研究人員利用數據挖掘的方法通過在軟件項目歷史數據中找尋軟件工作量屬性和項目其它屬性(例如軟件規模、軟件復雜度、應用領域、開發工具等)之間的關聯模式而對軟件項目工作量做出適當預測。當軟件項目歷史工作量數據被用于工作量估算,其背后基本的假設是軟件工作量歷史數據能夠被用于建構軟件工作量預測模型(統計學模型如線性回歸模型,或者機器學習模型如神經網絡模型)。然而,目前軟件工程界面臨的一個難題就是軟件工作量歷史數據中存在大量的缺失數據。而且,由于軟件工作量歷史數據集合較小,經典統計學常用的數據預處理方法——去除缺失數據的做法,往往會導致在預處理過后的數據集上建立的預測模型存在較大的偏差,進而影響預測模型的精度。由此,處理軟件工作量數據缺失已成為軟件工程領域一個比較活躍的研究方向。當前的軟件工作量預測中存在著兩種問題:缺失數據處理和預測模型構建。前者需要解決的問題是如何修復歷史項目記錄中缺失的屬性數據而后者要解決的問題是如何根據項目歷史數據構建合理的工作量預測模型。
發明內容
針對軟件成本估算面臨的歷史數據的不完全性的困難,以及現有軟件成本估算方法的不足,本發明提出一種基于數據挖掘的軟件工作量缺失數據修復及工作量預測方法(MissingImputation?Technique?and?Effort?Prediction?based?on?Data?Mining,MITEP-DM)。它改變了以往將項目缺失數據處理和預測模型建立割裂的方式,而將修復缺失數據和預測項目工作量結合起來考慮。本發明的目的是在不完全歷史項目數據條件下提高軟件項目工作量預測精度。
本發明的技術方案為:
一種新增軟件項目的軟件工作量預測方法,其步驟為:
1)從軟件項目數據庫中提取若干歷史軟件項目,并將歷史軟件項目的工作量數據離散化為l個類別,并分別標注每個歷史軟件項目的工作量類別;
2)提取每一歷史軟件項目的項目屬性數據,計算歷史軟件項目工作量類別的先驗概率分布,以及每個項目屬性在工作量類別上的條件概率分布,建立項目在工作量類別上的后驗概率分布模型,即貝葉斯分類模型;
3)提取每一新增軟件項目的項目屬性數據;
4)利用所建的貝葉斯分類模型對每一新增軟件項目進行分類,得到的工作量類別概率分布;
5)選取的工作量類別為使的在工作量類別上的后驗概率產生最大值的類別ct,t取值為1~l,l為自然數;
6)查找含有缺失數據的項目Ds,如果Ds在項目屬性Xj上的屬性值xsj缺失,則選取其他項目中屬性Xj上未出現缺失值的項目集合Dobs,j,利用Dobs,j中屬性Xj上的當前值xij修復xsj;
7)利用修復后的軟件項目數據計算項目屬性在工作量類別上的條件概率分布、工作量類別先驗概率和軟件項目在工作量類別上的后驗概率分布;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院軟件研究所,未經中國科學院軟件研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110083894.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:VGA視頻信號遠距離傳輸的裝置
- 下一篇:一種影像掃描系統、裝置及方法





