[發明專利]信息補充方法、裝置、電子設備及計算機可讀存儲介質在審
| 申請號: | 202010526769.2 | 申請日: | 2020-06-10 |
| 公開(公告)號: | CN111667013A | 公開(公告)日: | 2020-09-15 |
| 發明(設計)人: | 王建華;陳斌斌 | 申請(專利權)人: | 創新奇智(廣州)科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京超凡宏宇專利代理事務所(特殊普通合伙) 11463 | 代理人: | 蔣姍 |
| 地址: | 510700 廣東省廣州*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 信息 補充 方法 裝置 電子設備 計算機 可讀 存儲 介質 | ||
本發明涉及一種信息補充方法、裝置、電子設備及計算機可讀存儲介質,屬于數據挖掘領域。該方法先確定出目標降維方式;根據目標降維方式對數據所包括的特征進行篩選,得到選中特征及落選特征;用落選特征訓練根據任務場景所確定的基礎網絡模型,得到第一網絡模型,并獲取第一網絡模型針對落選特征輸出的第一預測值;將第一預測值所表征的信息補充到選中特征內,得到融合特征。針對上述融合特征而言,既對原始數據進行降維處理,降低了原始數據的數據量,又將由于降維操作導致的信息缺失的眾多特征作為新的一維特征加入到選中特征中,因此,最后得到的融合特征既可以防止數據量太大,又可以減少降維特的信息丟失。
技術領域
本申請屬于數據挖掘領域,具體涉及一種信息補充方法、裝置、電子設備及計算機可讀存儲介質。
背景技術
針對不同的任務場景,未被處理的數據往往包含許多冗余的特征。若不對數據進行處理,直接將未被處理的數據用于后續任務場景,龐大的數據量會增加后續任務場景的復雜度,不利用數據的后續應用,因此,一般會根據具體的任務場景對數據進行降維處理后,再基于降維后的數據進行后續任務。
然而,不可避免地,降維操作會導致數據出現信息缺失,又會對后續的任務帶來不好的影響。
發明內容
有鑒于此,本申請的目的在于提供一種信息補充方法、裝置、電子設備及計算機可讀存儲介質,在對數據進行降維的同時,盡可能少地減少數據的信息缺失。
本申請的實施例是這樣實現的:
第一方面,本申請實施例提供一種信息補充方法,所述方法包括:根據數據所適用的任務場景,確定出對所述數據的特征進行降維的目標降維方式;根據所述目標降維方式對所述數據所包括的特征進行篩選,得到選中特征及落選特征;基于所述落選特征對根據所述任務場景所確定的基礎網絡模型進行訓練,得到第一網絡模型,并獲取所述第一網絡模型針對所述落選特征輸出的第一預測值,所述第一預測值用于表征所述落選特征所包含的信息;將所述第一預測值所表征的信息補充到所述選中特征內,得到融合特征。針對上述融合特征而言,既對原始數據進行降維處理,降低了原始數據的數據量,又將由于降維操作導致的信息缺失的眾多特征所包括的與任務場景相關的信息作為新的一維特征加入到選中特征中,因此,最后得到的融合特征既可以防止數據量太大導致的復雜度,又可以盡可能地減少由于特征降維所導致的信息丟失,避免對后續任務帶來不好的影響。
結合第一方面實施例,在一種可能的實施方式中,所述將所述第一預測值所表征的信息補充到所述選中特征內,得到融合特征,包括:將所述第一預測值轉變成與所述選中特征同一數量級的新特征;將所述新特征加入到所述選中特征內,得到所述融合特征。
結合第一方面實施例,在一種可能的實施方式中,所述將所述第一預測值所表征的信息補充到所述選中特征內,得到融合特征,包括:基于所述選中特征對所述基礎網絡模型進行訓練,得到第二網絡模型,并獲取所述第二網絡模型針對所述選中特征輸出的第二預測值,所述第二預測值用于表征所述選中特征所包含的信息;獲取所述第一網絡模型的第一評價指標及所述第二網絡模型的第二評價指標;根據所述第一評價指標及所述第二評價指標對所述第一預測值及所述第二預測值進行加權求和,得到所述融合特征。
結合第一方面實施例,在一種可能的實施方式中,所述根據所述第一評價指標及所述第二評價指標對所述第一預測值及所述第二預測值進行加權求和,得到所述融合特征,包括:根據公式M=H1×Y1/(H1+H2)+H2×Y2/(H1+H2),得到所述融合特征;其中,M為所述融合特征,Y1為所述第一預測值,Y2為所述第二預測值,H1為所述第一評價指標,H2為所述第二評價指標。
結合第一方面實施例,在一種可能的實施方式中,所述基于所述落選特征對根據所述任務場景所確定的基礎網絡模型進行訓練,得到第一網絡模型,并獲取所述第一網絡模型針對所述落選特征輸出的第一預測值,包括:基于所述落選特征分別對多個所述基礎網絡模型進行訓練,得到多個預測值;將所述多個預測值進行加權求和,得到所述第一預測值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于創新奇智(廣州)科技有限公司,未經創新奇智(廣州)科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010526769.2/2.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





