[發明專利]一種針對產業整合對標管理工業大數據計算分類方法在審
| 申請號: | 202011139332.X | 申請日: | 2020-10-22 |
| 公開(公告)號: | CN112257780A | 公開(公告)日: | 2021-01-22 |
| 發明(設計)人: | 王榮浩;王敏;紀慧;米韻 | 申請(專利權)人: | 蘇州華檢工標信息技術有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 武漢智新達知識產權代理事務所(特殊普通合伙) 42272 | 代理人: | 陳文森 |
| 地址: | 215400 江蘇省蘇州市太*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 針對 產業 整合 理工 業大 數據 計算 分類 方法 | ||
1.一種針對產業整合對標管理工業大數據計算分類方法,其特征在于,包括以下步驟:
1)對有類標和無類標的數據分別進行預處理,得到對應的分類數據集A;
2)將步驟1)中的分類數據集進行特征選擇,并得到特征選擇后的分類數據集An;
3)將步驟2)中的分類數據集An按照向量模型進行計算,從而將分類數據集An分別轉化為對應的一維向量;
4)重復步驟1)、2)和3),并得到分類模型;
5)將數據S導入到分類模型中,并對數據S進行分詞得到數據S1;
6)分類模型對步驟5)中的數據S1建立向量模型,并提取數據S1特征;
7)在基于步驟6)中特征數據S1與其所有相關概率的前提下,判斷其是否完成計算;
8)若完成計算,則將數據S1分到與其最大相關類別,否則將數據S1再次進行計算;
9)判斷分類是否完成,完成分類,保存分類數據并進行上傳,否則重新對數據S1進行建立向量模型。
2.根據權利要求1所述的一種針對產業整合對標管理工業大數據計算分類方法,其特征在于:所述步驟3)中向量模型是將分類數據集An設置為一個由n維特征組成的向量,所述向量模型中每一個特征均為一個。
3.根據權利要求1所述的一種針對產業整合對標管理工業大數據計算分類方法,其特征在于:所述步驟3)中向量模型的計算按照TFIDF加權模型進行計算。
4.根據權利要求1所述的一種針對產業整合對標管理工業大數據計算分類方法,其特征在于:所述數據分類包括去除分詞與停用詞,且統計單個文件詞頻。
5.根據權利要求1所述的一種針對產業整合對標管理工業大數據計算分類方法,其特征在于:所述步驟4)中將有類標的一維向量按照貝葉斯算法計算,得到每個類別的先驗概率和每個詞條屬于每個類別的先驗概率。
6.根據權利要求5所述的一種針對產業整合對標管理工業大數據計算分類方法,其特征在于:所述先驗概率按照貝葉斯算法計算出無類標的一維向量中每個詞條可能屬于的類別,并將結果加入到之前有類標的新的一維向量中。
7.根據權利要求6所述的一種針對產業整合對標管理工業大數據計算分類方法,其特征在于:所述新的一維向量采用最大似然估計法,得到每個類別的先驗概率和每個詞條屬于每個類別的先驗概率。
8.根據權利要求5所述的一種針對產業整合對標管理工業大數據計算分類方法,其特征在于:所述先驗概率,按照貝葉斯算法計算,更新一維向量中每個詞條可能屬于的類別。
9.根據權利要求1所述的一種針對產業整合對標管理工業大數據計算分類方法,其特征在于:所述步驟4)中,重復步驟1)、2)和3),并直到一維向量中每個類別的先驗概率和每個詞條屬于每個類別的先驗概率收斂,從而得到分類模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州華檢工標信息技術有限公司,未經蘇州華檢工標信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011139332.X/1.html,轉載請聲明來源鉆瓜專利網。





