[發明專利]一種多標簽分類方法及裝置有效
| 申請號: | 201510068195.8 | 申請日: | 2015-02-09 |
| 公開(公告)號: | CN104615730B | 公開(公告)日: | 2017-10-27 |
| 發明(設計)人: | 范瑩;于治樓;梁華勇 | 申請(專利權)人: | 浪潮集團有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 濟南信達專利事務所有限公司37100 | 代理人: | 李世喆 |
| 地址: | 250100 山東*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 標簽 分類 方法 裝置 | ||
1.一種多標簽分類方法,其特征在于,包括:
A1:對訓練樣本進行聚類,并根據聚類后每個訓練樣本對應的標簽的劃分正確率對標簽進行排序,A1包括:
S1:根據訓練樣本的屬性將所有訓練樣本聚類為第一類和第二類;
S2:分別計算未記錄的每個標簽對應的訓練樣本在第一類中的第一數量和在第二類中的第二數量,以及第一類中其他訓練樣本的第三數量和第二類中其他訓練樣本的第四數量;
S3:根據每個標簽對應的第一數量、第二數量、第三數量和第四數量,計算每個標簽的劃分正確率,S3包括:
按照公式一計算每個標簽的劃分正確率,其中,公式一為:
ci=(|si0-ti0|+|si1-ti1|)/n×100%,ci為標簽i的劃分正確率,si1為標簽i對應的第一數量,ti1為標簽i對應的第二數量,si0為標簽i對應的第三數量,ti0為標簽i對應的第四數量,n為樣本的總量;
S4:記錄劃分正確率最大的標簽;
S5:判斷未記錄的標簽的數量是否為1,如果是,則執行步驟S7,否則,執行步驟S6;
S6:將當前記錄的標簽添加到訓練樣本的屬性中,返回S1;
S7:記錄最后一個標簽,按照記錄的先后順序給標簽排序;
A2:按照標簽順序對每個標簽對應的分類器進行排序;
A3:通過排序后的分類器對待分類數據進行分類。
2.一種多標簽分類裝置,其特征在于,包括:
排序單元,用于對訓練樣本進行聚類,并根據聚類后每個訓練樣本對應的標簽的劃分正確率對標簽進行排序,包括;
S1:根據訓練樣本的屬性將所有訓練樣本聚類為第一類和第二類;
S2:分別計算未記錄的每個標簽對應的訓練樣本在第一類中的第一數量和在第二類中的第二數量,以及第一類中其他訓練樣本的第三數量和第二類中其他訓練樣本的第四數量;
S3:根據每個標簽對應的第一數量、第二數量、第三數量和第四數量,計算每個標簽的劃分正確率,S3包括:
按照公式一計算每個標簽的劃分正確率,其中,公式一為:
ci=(|si0-ti0|+|si1-ti1|)/n×100%,ci為標簽i的劃分正確率,si1為標簽i對應的第一數量,ti1為標簽i對應的第二數量,si0為標簽i對應的第三數量,ti0為標簽i對應的第四數量,n為樣本的總量;
S4:記錄劃分正確率最大的標簽;
S5:判斷未記錄的標簽的數量是否為1,如果是,則執行步驟S7,否則,執行步驟S6;
S6:將當前記錄的標簽添加到訓練樣本的屬性中,返回S1;
S7:記錄最后一個標簽,按照記錄的先后順序給標簽排序;
訓練單元,用于按照標簽順序對每個標簽對應的分類器進行排序;
分類單元,用于通過排序后的分類器對待分類數據進行分類。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浪潮集團有限公司,未經浪潮集團有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510068195.8/1.html,轉載請聲明來源鉆瓜專利網。





