[發明專利]一種數據流分類方法、裝置及系統在審
| 申請號: | 201911183941.2 | 申請日: | 2019-11-27 |
| 公開(公告)號: | CN112861894A | 公開(公告)日: | 2021-05-28 |
| 發明(設計)人: | 趙禮菁;胡翔;杜靜波;馮張瀟 | 申請(專利權)人: | 華為技術有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京同達信恒知識產權代理有限公司 11291 | 代理人: | 張翠華 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據流 分類 方法 裝置 系統 | ||
本申請公開了一種數據流分類方法、裝置及系統,用以解決效率低的問題。針對數據流,先通過SA特征庫進行分類,針對無法匹配的數據流通過分類模型來執行分類。分類模型訓練時,通過SA特征庫分類后能夠確定類別的數據流,基于分類結果進行標簽標注,然后用于訓練模型。無需人工參與,可提高效率。另外,針對在分類模型訓練和識別過程中獲取用于識別得到分類結果的特征規則,并用于更新SA特征庫,無需人工參與更新特征庫,可進一步提高效率。
技術領域
本申請實施例涉及通信技術領域,尤其涉及一種數據流分類方法、裝置及系統。
背景技術
隨著近年來移動互聯網的高速發展,AR/VR、4K高清視頻等新應用不斷涌現,帶來了移動數據業務的爆發式增長。針對運營商來說迫切需要的是:進行基于業務內容的差異化計費。為了實現基于業務內容的差異化計費,主要是識別業務內容。目前采用業務感知(service awareness,SA)技術來識別業務內容。SA技術,是在分析包頭的基礎上,能夠深度分析數據包所攜帶的4~7層協議的特征,是一種基于應用層信息檢測和控制技術。SA采用SA特征庫的方式進行識別,因此網元的識別能力需要依賴SA特征庫的開發與升級,識別更新后的業務內容需要人工對特征庫升級后才能夠識別,并且在SA特征庫升級之前無法獲取到分類結果,導致效率較低。
發明內容
本申請實施例提供一種數據流分類方法、裝置及系統,用以解決效率低的問題。
第一方面,本申請實施例提供一種數據流分類方法,包括:根據業務感知SA特征庫對采集到的數據流進行分類得到采集到的數據流中的N個第一數據流分別所屬的類別,并確定所述采集到的數據流中M個第二數據流與SA特征庫中的特征規則不匹配,M和N為正整數;根據所述N個第一數據流分別所屬的類別對所述N個第一數據流進行標簽標注,并根據所述N個第一數據流以及所述N個第一數據流分別所標注的標簽對待訓練模型進行訓練得到分類模型;根據所述分類模型對所述M個第二數據流進行分類得到所述M個第二數據流所屬的類別。
上述方法,通過SA特征庫對數據流分類后,采用識別確定類別的數據流訓練模型,然后對于無法匹配的數據流采用訓練后的分類模型進行識別,可以提高識別度,無需依賴特征庫的開發與升級,可以提高效率。另外,無需人工的參與,即能夠識別到升級后的數據流所屬類別。此外,通過SA特征庫的匹配結果對數據流進行標注,采用標注后的數據流訓練模型,無需人工參與標注,能夠提高效率。
在一種可能的設計中,還包括:獲取所述N個第一數據流中每個第一數據流所包括的字段的重要度,以及獲取所述M個第二數據流每個數據流所包括的字段的重要度,每個字段的重要度用于表征所述每個字段對所述每個字段所屬的數據流的分類結果產生影響的重要程度;然后,根據所述N個第一數據流和所述M個第二數據流中每個數據流包括的字段的重要度和所述每個數據流所屬的類別生成特征規則,所述特征規則用于更新所述SA特征庫。
通過上述設計,在模型訓練和識別過程中獲取識別數據流所屬類別的特征規則,用于更新SA特征庫,無需人工參與升級SA特征庫,進一步提高效率。
在一種可能的設計中,根據所述N個第一數據流和所述M個第二數據流中每個數據流包括的字段的重要度和所述每個數據流所屬的類別生成特征規則,包括:
確定N個第一數據流中屬于第一類別的至少一個第一數據流中包括的K1個特征字段,所述K1個特征字段中每個特征字段的重要度大于所述至少一個第一數據流包括的字段中除所述K1個特征字段以外的其它字段;確定M個第二數據流中屬于第一類別的至少一個第二數據流中包括的K2個特征字段,所述K2個特征字段中每個特征字段的重要度大于所述至少一個第二數據流包括的字段中除所述K2個特征字段以外的其它字段;K1和K2為正整數;然后,根據所述K1個特征字段以及所述K2個特征字段生成所述第一類別對應的特征規則。
上述設計中,采用重要度較高的字段作為特征字段,提高識別的準確度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司,未經華為技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911183941.2/2.html,轉載請聲明來源鉆瓜專利網。





