[發(fā)明專利]數(shù)據(jù)分類方法和裝置有效
| 申請?zhí)枺?/td> | 201410117603.X | 申請日: | 2014-03-26 |
| 公開(公告)號: | CN104951791B | 公開(公告)日: | 2018-10-09 |
| 發(fā)明(設計)人: | 江焯林;甄毅;楊強 | 申請(專利權)人: | 華為技術有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/66 |
| 代理公司: | 北京同立鈞成知識產(chǎn)權代理有限公司 11205 | 代理人: | 劉芳 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數(shù)據(jù) 分類 方法 裝置 | ||
本發(fā)明實施例提供一種數(shù)據(jù)分類方法和裝置。其中,方法包括:根據(jù)從待分類數(shù)據(jù)中抽取到的至少一個特征對所述待分類數(shù)據(jù)進行歸一化處理,以使所述待分類數(shù)據(jù)的各個特征對應的數(shù)據(jù)取值范圍一致,形成所述待分類數(shù)據(jù)的特征數(shù)據(jù);利用二值化壓縮碼編碼器處理所述待分類數(shù)據(jù)的特征數(shù)據(jù),得到所述待分類數(shù)據(jù)的二值化壓縮碼;利用基于二值化壓縮碼的分類器對所述待分類數(shù)據(jù)的二值化壓縮碼進行分類處理,獲得所述待分類數(shù)據(jù)的類別。本發(fā)明實施例提供的數(shù)據(jù)分類方法和裝置,可以克服現(xiàn)有技術的數(shù)據(jù)分類方法計算量過大,計算效率低的問題。
技術領域
本發(fā)明實施例涉及通信技術,尤其涉及一種數(shù)據(jù)分類方法和裝置。
背景技術
數(shù)據(jù)分類技術一直是IT工業(yè)界和學術界的研究熱點。數(shù)據(jù)分類技術可以包括圖片場景分類、文本分類(例如應用于多語言文本情感分類領域)、多媒體語義分類(例如應用于多媒體語義識別領域)。圖片場景分類可以為圖片的后續(xù)處理提供方便,一個潛在的應用場合是在手機平臺上。隨著智能手機的普及,手機拍照已經(jīng)成為手機的第二大功能。通過手機拍攝場景圖片而識別出用戶所處的環(huán)境,可以為用戶提供相關服務,例如判定拍攝圖片是在會議廳,自動設置成會議狀態(tài)模式,使得手機變得更加智能。
現(xiàn)有的數(shù)據(jù)分類技術是基于實特征向量進行分類,使用實數(shù)值的特征表示作為輸入進行分類器訓練,但這種技術需要耗費大量的計算資源,計算效率低,不適用于大規(guī)模數(shù)據(jù)的分類。
發(fā)明內(nèi)容
本發(fā)明實施例提供一種數(shù)據(jù)分類方法和裝置,以克服現(xiàn)有技術的數(shù)據(jù)分類方法計算量過大,計算效率低的問題。
第一方面,本發(fā)明實施例提供一種數(shù)據(jù)分類方法,包括:
根據(jù)從待分類數(shù)據(jù)中抽取到的至少一個特征對所述待分類數(shù)據(jù)進行歸一化處理,以使所述待分類數(shù)據(jù)的各個特征對應的數(shù)據(jù)取值范圍一致,形成所述待分類數(shù)據(jù)的特征數(shù)據(jù);
利用二值化壓縮碼編碼器處理所述待分類數(shù)據(jù)的特征數(shù)據(jù),得到所述待分類數(shù)據(jù)的二值化壓縮碼;
利用基于二值化壓縮碼的分類器對所述待分類數(shù)據(jù)的二值化壓縮碼進行分類處理,獲得所述待分類數(shù)據(jù)的類別。
在第一方面的第一種可能的實現(xiàn)方式中,在所述根據(jù)從待分類數(shù)據(jù)中抽取到的至少一個特征對所述原始數(shù)據(jù)進行歸一化處理,以使所述待分類數(shù)據(jù)的各個特征對應的數(shù)據(jù)取值范圍一致,形成所述待分類數(shù)據(jù)的特征數(shù)據(jù)之前,還包括:
對樣本數(shù)據(jù)進行歸一化處理,以使所述樣本數(shù)據(jù)的各個特征對應的數(shù)據(jù)取值范圍一致,形成壓縮碼訓練數(shù)據(jù),所述樣本數(shù)據(jù)來自于所述待分類數(shù)據(jù);
利用所述壓縮碼訓練數(shù)據(jù)對二值化壓縮碼編碼器進行編碼器訓練,獲得二值化壓縮碼編碼器,并獲得二值化壓縮碼;
將所述二值化壓縮碼作為分類器訓練數(shù)據(jù),對分類器進行訓練,獲得基于二值化壓縮碼的分類器。
根據(jù)第一方面的第一種可能的實現(xiàn)方式,在第二種可能的實現(xiàn)方式中,所述利用所述壓縮碼訓練數(shù)據(jù)對二值化壓縮碼編碼器進行編碼器訓練,獲得二值化壓縮碼編碼器,包括:
利用所述壓縮碼訓練數(shù)據(jù),根據(jù)以下使分類誤差的目標函數(shù)最小化的公式進行編碼器訓練:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司,未經(jīng)華為技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410117603.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結構
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





