[發明專利]一種需求功能點智能識別系統在審
| 申請號: | 201811132214.9 | 申請日: | 2018-09-27 |
| 公開(公告)號: | CN109255127A | 公開(公告)日: | 2019-01-22 |
| 發明(設計)人: | 史建琦;李志輝;黃滟鴻;鮑鈺;戰云龍;孫文圣 | 申請(專利權)人: | 華東師范大學;上海博預網絡科技有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27 |
| 代理公司: | 北京辰權知識產權代理有限公司 11619 | 代理人: | 劉廣達 |
| 地址: | 200062 上*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 功能點 句法分析結果 詞法分析 句法分析 需求功能 詞法分析模塊 智能識別系統 自然語言處理 預處理模塊 詞性標注 命名實體 人工分析 識別系統 智能分析 分詞 剔除 統計 | ||
本發明公開了一種需求功能點識別系統,包括:需求規格書預處理模塊,用于將需求規格書進行段落拆分,將需求規格書的多級標題剔除,得到初級規格書;詞法分析模塊,用于將初級規格書進行分詞、詞性標注、命名實體識別,產生詞法分析結果;句法分析模塊,用于將詞法分析結果進行句法分析,產生句法分析結果;功能點識別模塊,用于根據句法分析結果進行功能點識別,并統計功能點類別和數量。本發明通過結合自然語言處理(NLP)技術對需求規格書進行智能分析,實現對需求規格書所含功能的準確快速統計,代替人工分析,提高效率,降低成本。
技術領域
本發明涉及自然語言處理和軟件工程秀分析領域,特別涉及一種需求功能點智能識別系統。
背景技術
在傳統的需求功能點評估領域,功能點的判斷識別有兩種處理情況,其一,不將功能點識別納入考慮范圍,不去評估這些功能所代表的工作量與價值,導致軟件的外包定制存在不統一的價格要求與時間要求。其二,軟件功能評估依靠人工分析來識別。因為需求規格書往往多達百頁,甚至更多。所以,這種以人工為主的做法,不僅需要資深的領域專家介入,而且非常的耗費時間和精力。間接的增加了軟件工程的環節,增加了軟件開發的費用。同時人工分析存在不確定性,不穩定性。這些原因導致需求功能點識別不夠智能和高效。
隨著社會生產領域大量的軟件需求的出現,需求規格書也急速增加,而針對軟件功能評估人才還很缺乏。大量的需求功能識別評估工作,亟須一種自動而又智能的方法來處理。
發明內容
本發明的目的是通過以下技術方案實現的。為處理上述問題,本發明構造一種基于自然語言處理(NLP)技術的功能點智能識別系統。本發明構造的智能系統可有效挖掘需求規格書中的功能點,通過結合NLP技術對需求規格書逐段,逐句,逐詞的拆解分析。挖掘出每一個詞的詞性,識別句子中的命名實體和提取出句子中各個部分之間的依存關系,通過句法關系匹配和關鍵詞匹配,最終實現功能點的識別并歸類。減少人類分析提取的低效和不穩定性。
一種需求功能點識別系統,包括:
需求規格書預處理模塊,用于將需求規格書進行段落拆分,將所述需求規格書的多級標題剔除,得到初級規格書;
詞法分析模塊,用于將所述初級規格書進行分詞、詞性標注、命名實體識別,產生詞法分析結果;
句法分析模塊,用于將所述詞法分析結果進行句法分析,產生句法分析結果;
功能點識別模塊,用于根據所述句法分析結果進行功能點識別,并統計功能點類別和數量。
優選地,需求規格書為需要分析的中文版的需求規格書,所述需求規格書預處理模塊利用Lucene框架將所述需求規格書進行段落拆分。
優選地,詞法分析模塊包括:
分詞單元,采用基于最大熵分詞方法,將字符串頻率統計和字符串匹配結合;
詞性標注單元,采用基于最大熵的詞性標注方法,以高頻詞性為依據進行標注;
命名實體識別單元,采用條件隨機場算法作為判別式概率模型。
優選地,詞法分析模塊采用神經網絡模型,進行分詞、詞性標注、命名實體識別。
優選地,所述神經網絡模型詞法分析模塊利用AC多模式匹配算法實現分詞,或者利用基于所述需求規格書中的自定義詞典進行分詞,所述分詞策略采用字典詞匯最長匹配原則。
優選地,句法分析模塊進行句法分析包括:句子中詞語的依賴關系分析、搭配關系分析。
優選地,句法分析模塊利用基于最大熵模型的最大生成樹算法進行所述需求規格書的中文依存句法的分析,最大熵依存利用條件概率模型,將所有依存關系概率的累積作為目標函數的打分,取打分最大的依存關系樹作為輸出。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華東師范大學;上海博預網絡科技有限公司,未經華東師范大學;上海博預網絡科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811132214.9/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:文章推薦方法及裝置
- 下一篇:多層級標簽的生成方法、裝置和存儲介質





