[發(fā)明專利]業(yè)務識別方法、裝置、終端設備及存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 201711409689.3 | 申請日: | 2017-12-20 |
| 公開(公告)號: | CN108154177B | 公開(公告)日: | 2020-01-21 |
| 發(fā)明(設計)人: | 梁勇華;鄭濤;張淵;戴晶華;嚴俏艷;張燕君 | 申請(專利權)人: | 宜通世紀科技股份有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06F17/16 |
| 代理公司: | 44202 廣州三環(huán)專利商標代理有限公司 | 代理人: | 麥小嬋;郝傳鑫 |
| 地址: | 510665 廣東省廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 業(yè)務識別 業(yè)務數(shù)據(jù) 矩陣 樣本數(shù)據(jù) 存儲介質(zhì) 終端設備 矩陣化處理 曼哈頓距離 樣本數(shù)據(jù)庫 預先建立 頻數(shù) | ||
1.一種業(yè)務識別方法,其特征在于,包括:
獲取待識別業(yè)務數(shù)據(jù);
根據(jù)預先設定的識別元素,提取所述待識別業(yè)務數(shù)據(jù)中對應識別元素的識別關鍵詞;其中,所述識別元素包括TCP/IP五元組、HOST、URL、UserAgent、Referuri、Cookie、RequestMethod、Connection、Accept、Server和Content-Type中的一種或多種;
對所述識別關鍵詞進行矩陣化處理:以行代表所述待識別業(yè)務數(shù)據(jù),以每一列代表一個樣本關鍵詞,根據(jù)所述待識別業(yè)務數(shù)據(jù)包含的識別關鍵詞,對所述樣本關鍵詞所在的列進行取值,得到所述待識別業(yè)務數(shù)據(jù)矩陣A(X1,X2,…,Xn);其中,所述樣本關鍵詞是從預先建立的樣本數(shù)據(jù)庫中的所有樣本數(shù)據(jù)所對應的識別元素預先提取出來;
采用KNN算法建立業(yè)務識別模型,判斷所述待識別業(yè)務數(shù)據(jù)所屬的業(yè)務:計算所述待識別業(yè)務數(shù)據(jù)矩陣A(X1,X2,…,Xn)和預先建立的樣本數(shù)據(jù)庫中的每一條樣本數(shù)據(jù)矩陣B(Y1,Y2,…,Yn)的哈曼頓距離:
dist(A,B)=|X1-Y1|+|X2-Y2|+…+|Xn-Yn|
取曼哈頓距離最小的K條樣本數(shù)據(jù),所述K條樣本數(shù)據(jù)中頻數(shù)最高的業(yè)務則為所述待識別業(yè)務數(shù)據(jù)所屬的業(yè)務;
其中,所述Xn和Yn分別表示所述待識別業(yè)務數(shù)據(jù)和所述每一條樣本數(shù)據(jù)是否包含“樣本關鍵詞n”的取值,若包含“樣本關鍵詞n”,則取值為a,若不包含“樣本關鍵詞n”,則取值為b,且a≠b。
2.根據(jù)權利要求1所述的業(yè)務識別方法,其特征在于,還包括:
取所述待識別業(yè)務數(shù)據(jù)矩陣A(X1,X2,…,Xn)和與其最鄰近的一條樣本數(shù)據(jù)矩陣N(Z1,Z2,…,Zn);
計算識別結果的校驗指數(shù)J:
J=dist(A)+dist(N)-dist(A,N)
其中,dist(A)=X1+X2+…+Xn;dist(N)=Z1+Z2+…+Zn;
dist(A,N)=|X1-Z1|+|X2-Z2|+…+|Xn-Zn|;
若所述校驗指數(shù)J大于等于閾值T,則識別結果校驗通過,完成識別;若所述校驗指數(shù)J小于閾值T,則識別結果校驗不通過,轉(zhuǎn)入人工識別;
其中,所述閾值T為所述待識別業(yè)務數(shù)據(jù)和與其最鄰近的一條樣本數(shù)據(jù)包含共同樣本關鍵詞的個數(shù)的兩倍。
3.根據(jù)權利要求1所述的業(yè)務識別方法,其特征在于:所述K取值為5,7,9或11。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于宜通世紀科技股份有限公司,未經(jīng)宜通世紀科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711409689.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 業(yè)務數(shù)據(jù)分類方法和裝置
- 業(yè)務數(shù)據(jù)保存方法及裝置
- 基于區(qū)塊鏈的業(yè)務數(shù)據(jù)處理方法、裝置及存儲介質(zhì)
- 業(yè)務數(shù)據(jù)處理方法及系統(tǒng)
- 業(yè)務SBB的業(yè)務數(shù)據(jù)管理方法、裝置、設備及存儲介質(zhì)
- 業(yè)務數(shù)據(jù)處理方法、裝置、存儲介質(zhì)和計算機設備
- 一種業(yè)務數(shù)據(jù)的分發(fā)方法及裝置
- 一種數(shù)據(jù)發(fā)送的方法及裝置
- 一種業(yè)務數(shù)據(jù)安全指數(shù)的評估方法及裝置
- 頻繁項業(yè)務數(shù)據(jù)挖掘分析方法及業(yè)務數(shù)據(jù)挖掘設備





