[發明專利]一種行業應用軟件詞根表的分類進退方法有效
| 申請號: | 201310077358.X | 申請日: | 2013-03-12 |
| 公開(公告)號: | CN103116658A | 公開(公告)日: | 2013-05-22 |
| 發明(設計)人: | 左春;張正;龐樸;魏萍 | 申請(專利權)人: | 中科軟科技股份有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京君尚知識產權代理事務所(普通合伙) 11200 | 代理人: | 余長江 |
| 地址: | 100080 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 行業 應用軟件 詞根 分類 進退 方法 | ||
1.一種行業應用軟件詞根表的分類進退方法,其步驟為:
1)在詞根表數據庫中建立一當前庫和一歷史庫,將當前庫中的詞根按照遞進分類方法進行分組,每一分組設有一最大容量值;
2)當一新詞根需要加入詞根表時,根據詞根的適合系數確定其所對應的分組Ti,將其添加到該分組Ti并自動補充該詞根的屬性;
3)如果該Ti分組中詞根總數超過其最大容量值ki,則進行降級操作:將該分組Ti中所有詞根按適合系數排序,適合系數最小的詞根進入其前一分組Ti-1;
4)依次觸發降級操作直到某一分組中的詞根總數未超過其最大容量值,如果適合系數最低分組T1發生降級,則將分組T1中適合系數最小詞根移到歷史庫。
2.如權利要求1所述的方法,其特征在于根據詞根的適合系數將詞根表劃分為當前庫和歷史庫;將詞根表數據庫中的詞根按照適合系數進行排序,將排序靠前的N個詞根放入當前庫,剩余的詞根進入歷史庫。
3.如權利要求1或2所述的方法,其特征在于所述遞進分類方法為按照詞根的使用頻率將當前庫中的詞根分為具有遞進關系的多個分組。
4.如權利要求3所述的方法,其特征在于所述分組的劃分方法為:
1)根據實際業務中的數據字段名/數據表名,程序變量名/程序表名生成數據字典;
2)檢索數據字典,確定詞根表中每一詞根的使用頻率;
3)按照詞根的使用頻率從大到小的順序,依次將詞根表當前庫中的詞根分為k個使用頻
率依次降低的分組(Tk、…,T2,T1),Ti分組的最大容量設為ki,∑ki=N。
5.如權利要求1或2所述的方法,其特征在于根據規范文件ACORD文件、金融術語文件、《精編英漢保險詞典》、保險術語表和保險術語文件計算所述適合系數,其方法為:
51)檢索保險術語表是否存在該詞根英文名稱,記為v1,存在則v1=1,反之則為0;
52)檢索ACORD文件是否存在該詞根英文名稱,記為v2,存在則v2=1,反之則為0;
53)檢索《精編英漢保險詞典》,確認該詞根英文名稱的中文含義中是否有對應的中文名稱,記為v3,存在則v3=1,反之則為0;
54)檢索保險術語文件是否存在該詞根中文名稱,記為v4,存在則v4=1,反之則為0;
55)檢索金融術語文件是否存在該詞根中文名稱,記為v5,存在則v5=1,反之則為0;
56)檢索《精編英漢保險詞典》,確認該詞根中文名稱的含義中是否有對應的中文含義,記為v6,,存在則v6=1,反之則為0;
57)計算該詞根的適合系數fitness=α1v1+α2v2+α3v3+α4v4+α5v5+α6v6,其中,α1+α2+α3+α4+α5+α6=1。
6.如權利要求1或2所述的方法,其特征在于對所述當前庫進行定期巡查更新,其方法為:首先定期檢索數據字典,確認使用頻率變化的詞根;然后計算使用頻率變化的詞根的適合系數,根據適合系數將其插入到相應的目標分組;若目標分組中詞根總數超過該分組的最大容量值,則觸發降級操作。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中科軟科技股份有限公司,未經中科軟科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310077358.X/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種可變錘篩間隙粉碎機轉子
- 下一篇:一種訓練用籃球架





