[發明專利]一種項目清單的分類方法及裝置有效
| 申請號: | 201811275339.7 | 申請日: | 2018-10-30 |
| 公開(公告)號: | CN109389321B | 公開(公告)日: | 2021-08-06 |
| 發明(設計)人: | 吳英禮;胡婧玥;樊少勇;孫茹茹 | 申請(專利權)人: | 北京筑龍信息技術有限責任公司 |
| 主分類號: | G06Q10/06 | 分類號: | G06Q10/06;G06Q30/02 |
| 代理公司: | 北京超凡志成知識產權代理事務所(普通合伙) 11371 | 代理人: | 梁香美 |
| 地址: | 100100 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 項目 清單 分類 方法 裝置 | ||
1.一種項目清單的分類方法,其特征在于,包括:
獲取樣本項目清單集,所述樣本項目清單集包括多個樣本項目清單,每個樣本項目清單中均攜帶有清單屬性信息和項目屬性信息;
針對所述樣本項目清單集中的每個樣本項目清單,根據該樣本項目清單中攜帶的項目屬性信息,從各預設項目類型中確定該樣本項目清單所屬的項目類型;
針對確定的每個項目類型,確定與該項目類型對應的至少一個樣本項目清單;獲取預設清單詞匯庫,所述預設清單詞匯庫中包括與各個預設項目類型對應的預設清單詞匯;
針對確定的每個項目類型,確定與該項目類型對應的至少一個預設清單詞匯;采用TF-IDF算法確定與該項目類型對應的各預設清單詞匯在每個樣本項目清單中出現的次數,以及每個預設清單詞匯在該項目類型對應的所有樣本項目清單中出現的總次數;從所有預設清單詞匯中篩選出與該項目類型對應的每個樣本項目清單的目標清單詞匯;
從確定的每個樣本項目清單中提取出樣本項目清單特征,包括:
基于篩選出的與該項目類型對應的每個樣本項目清單的目標清單詞匯,從確定的每個樣本項目清單中提取出樣本項目清單特征;
根據提取出的所有樣本項目清單特征將該項目類型對應的所有樣本項目清單進行聚類,得到與所述清單屬性信息對應的至少一個樣本項目清單子集;確定每個樣本項目清單子集的價格區間信息。
2.根據權利要求1所述的方法,其特征在于,所述項目屬性信息包括項目類型信息和項目描述信息;所述根據該樣本項目清單中攜帶的項目屬性信息,從各預設項目類型中確定該樣本項目清單所屬的項目類型,包括:
針對所述樣本項目清單集中的每個樣本項目清單,根據該樣本項目清單的項目類型信息確定該樣本項目清單所屬的第一級項目類型;確定該樣本項目清單所屬的第一級項目類型對應的其他樣本項目清單;
根據該樣本項目清單的項目類型信息和項目描述信息,以及其他樣本項目清單的項目類型信息和項目描述信息,從其他樣本項目清單中確定與該樣本項目清單屬于同類工程的樣本項目清單,并將確定的樣本項目清單所屬的第二級項目類型作為該樣本項目清單所屬的第二級項目類型。
3.根據權利要求2所述的方法,其特征在于,所述清單屬性信息包括清單價格信息;在確定每個樣本項目清單所屬的第二級項目類型之后,還包括:
針對確定的每個第二級項目類型,確定與該第二級項目類型對應的至少一個樣本項目清單;根據確定的每個樣本項目清單的清單價格信息由大到小的順序對所有樣本項目清單進行排序;從所有樣本項目清單中篩選出符合預設排序名次的樣本項目清單作為與該第二級項目類型對應的目標樣本項目清單。
4.根據權利要求1或3所述的方法,其特征在于,所述清單屬性信息包括清單標識信息;所述根據提取出的所有樣本項目清單特征將該項目類型對應的所有樣本項目清單進行聚類,得到與所述清單屬性信息對應的至少一個樣本項目清單子集,包括:
從該項目類型對應的所有樣本項目清單中隨機選取出預設數量個樣本項目清單作為聚類的質心;
將該項目類型對應的所有樣本項目清單中剩余的樣本項目清單分配至距離最小的質心所對應的聚類中;其中,所述剩余的樣本項目清單與每個質心之間的距離由兩者對應的樣本項目清單特征的特征相似度以及兩者對應的清單標識信息確定;
重新計算每個聚類的質心,并基于計算后的質心,重新對該項目類型對應的所有樣本項目清單中的每一樣本項目清單進行聚類分配,直至在判斷出更新后的質心與更新前的質心符合預設距離閾值時,停止聚類分配,得到與每個所述清單標識信息對應的至少一個樣本項目清單子集。
5.根據權利要求4所述的方法,其特征在于,所述確定每個樣本項目清單子集的價格區間信息,包括:
針對每個清單標識信息,確定與該清單標識信息對應的每個樣本項目清單子集中具有最高清單價格的樣本項目清單,以及具有最低清單價格的樣本項目清單;
基于所述最高清單價格和所述最低清單價格確定與該清單標識信息對應的每個樣本項目清單子集的價格區間信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京筑龍信息技術有限責任公司,未經北京筑龍信息技術有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811275339.7/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





