[發(fā)明專利]一種特征構(gòu)造方法、裝置、機(jī)器可讀介質(zhì)及設(shè)備在審
| 申請?zhí)枺?/td> | 202010831984.3 | 申請日: | 2020-08-18 |
| 公開(公告)號: | CN111985553A | 公開(公告)日: | 2020-11-24 |
| 發(fā)明(設(shè)計)人: | 周曦;姚志強(qiáng);陳琳;盧智聰;趙禮悅;翁謙;張博宣;張旭;蔣博劼;曹文飛 | 申請(專利權(quán))人: | 北京云從科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N20/00 |
| 代理公司: | 上海光華專利事務(wù)所(普通合伙) 31219 | 代理人: | 代玲 |
| 地址: | 102300 北京市門頭溝區(qū)石*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 特征 構(gòu)造 方法 裝置 機(jī)器 可讀 介質(zhì) 設(shè)備 | ||
1.一種特征構(gòu)造方法,其特征在于,包括:
獲取待處理對象的原始特征;
對所述原始特征進(jìn)行特征處理,得到特征處理結(jié)果;其中,所述特征處理包括特征擴(kuò)展或/和編碼轉(zhuǎn)換,所述特征處理結(jié)果包括擴(kuò)展特征或/和編碼特征;
基于所述原始特征、所述特征處理結(jié)果得到目標(biāo)特征集。
2.根據(jù)權(quán)利要求1所述的特征構(gòu)造方法,其特征在于,對所述原始特征進(jìn)行特征處理,得到特征處理結(jié)果,包括:
識別所述原始特征的特征類型,所述特征類型包括數(shù)值型和離散型;
對離散型的原始特征進(jìn)行編碼轉(zhuǎn)換,得到編碼特征;
利用所述原始特征、所述編碼特征進(jìn)行特征擴(kuò)展,得到一個或多個擴(kuò)展特征。
3.根據(jù)權(quán)利要求2所述的特征構(gòu)造方法,其特征在于,根據(jù)業(yè)務(wù)含義對所述原始特征、所述編碼特進(jìn)行特征擴(kuò)展。
4.根據(jù)權(quán)利要求2所述的特征構(gòu)造方法,其特征在于,所述編碼轉(zhuǎn)換包括以下至少之一:整數(shù)編碼、Onehot編碼、二進(jìn)制編碼。
5.根據(jù)權(quán)利要求1所述的特征構(gòu)造方法,其特征在于,該還包括:
基于所述原始特征、所述特征處理結(jié)果構(gòu)造特征數(shù)據(jù)全集;
根據(jù)條件謂詞對所述特征數(shù)據(jù)全集進(jìn)行篩選,得到一個或多個特征數(shù)據(jù)子集;
利用聚合函數(shù)對所述一個或多個特征數(shù)據(jù)子集進(jìn)行聚合統(tǒng)計,得到一個或多個候選特征集;
對所述一個或多個候選特征集進(jìn)行關(guān)聯(lián)運(yùn)算,得到目標(biāo)特征集。
6.根據(jù)權(quán)利要求5所述的特征構(gòu)造方法,其特征在于,所述聚合統(tǒng)計包括以下至少之一:平均值、方差、最大值、最小值、總和、不同值總數(shù)、最多取值占比、熵、HHI。
7.一種特征構(gòu)造裝置,其特征在于,包括:
特征獲取模塊,用于獲取待處理對象的原始特征;
特征處理模塊,用于對所述原始特征進(jìn)行特征處理,得到特征處理結(jié)果;其中,所述特征處理包括特征擴(kuò)展或/和編碼轉(zhuǎn)換,所述特征處理結(jié)果包括擴(kuò)展特征或/和編碼特征;
目標(biāo)特征獲取模塊,用于基于所述原始特征、所述特征處理結(jié)果得到目標(biāo)特征集。
8.根據(jù)權(quán)利要求7所述的特征構(gòu)造裝置,其特征在于,所述特征處理模塊包括:
特征類型識別子模塊,用于識別所述原始特征的特征類型,所述特征類型包括數(shù)值型和離散型;
特征轉(zhuǎn)換子模塊,用于對離散型的原始特征進(jìn)行編碼轉(zhuǎn)換,得到編碼特征;
特征擴(kuò)展子模塊,用于利用所述原始特征、所述編碼特征進(jìn)行特征擴(kuò)展,得到一個或多個擴(kuò)展特征。
9.根據(jù)權(quán)利要求8所述的特征構(gòu)造裝置,其特征在于,根據(jù)業(yè)務(wù)含義對所述原始特征、所述編碼特進(jìn)行特征擴(kuò)展。
10.根據(jù)權(quán)利要求8所述的特征構(gòu)造裝置,其特征在于,所述編碼轉(zhuǎn)換包括以下至少之一:整數(shù)編碼、Onehot編碼、二進(jìn)制編碼。
11.根據(jù)權(quán)利要求7所述的特征構(gòu)造裝置,其特征在于,還包括:
特征組合模塊,用于基于所述原始特征、所述特征處理結(jié)果構(gòu)造特征數(shù)據(jù)全集;
特征篩選模塊,用于根據(jù)條件謂詞對所述特征數(shù)據(jù)全集進(jìn)行篩選,得到一個或多個特征數(shù)據(jù)子集;
特征聚合模塊,用于利用聚合函數(shù)對所述一個或多個特征數(shù)據(jù)子集進(jìn)行聚合統(tǒng)計,得到一個或多個候選特征集;
特征關(guān)聯(lián)模塊,用于對所述一個或多個候選特征集進(jìn)行關(guān)聯(lián)運(yùn)算,得到目標(biāo)特征集。
12.一種設(shè)備,其特征在于,包括:
一個或多個處理器;和
其上存儲有指令的一個或多個機(jī)器可讀介質(zhì),當(dāng)所述一個或多個處理器執(zhí)行時,使得所述設(shè)備執(zhí)行如權(quán)利要求1-6中一個或多個所述的方法。
13.一個或多個機(jī)器可讀介質(zhì),其特征在于,其上存儲有指令,當(dāng)由一個或多個處理器執(zhí)行時,使得設(shè)備執(zhí)行如權(quán)利要求1-6中一個或多個所述的方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京云從科技有限公司,未經(jīng)北京云從科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010831984.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





