[發(fā)明專利]信息處理方法、裝置、計算機可讀存儲介質(zhì)和計算機設(shè)備在審
| 申請?zhí)枺?/td> | 202111031124.2 | 申請日: | 2021-09-03 |
| 公開(公告)號: | CN114357152A | 公開(公告)日: | 2022-04-15 |
| 發(fā)明(設(shè)計)人: | 李磊;林衍凱;任抒懷;李鵬;周杰;孫栩 | 申請(專利權(quán))人: | 北京大學;騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/216;G06K9/62;G06N3/08 |
| 代理公司: | 深圳翼盛智成知識產(chǎn)權(quán)事務(wù)所(普通合伙) 44300 | 代理人: | 李漢亮 |
| 地址: | 100871*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 信息處理 方法 裝置 計算機 可讀 存儲 介質(zhì) 設(shè)備 | ||
1.一種信息處理方法,其特征在于,包括:
獲取目標樣本;
采用預設(shè)分類模型對所述目標樣本進行分類處理,得到所述目標樣本對應(yīng)的第一類別概率分布;
根據(jù)所述第一類別概率分布計算所述目標樣本的困難系數(shù),并基于所述困難系數(shù)對所述目標樣本進行篩選,得到篩選后目標樣本,所述困難系數(shù)表征預設(shè)分類模型輸出所述目標樣本對應(yīng)的每一類別概率的不確定程度;
采用訓練后深度分類模型對所述篩選后目標樣本進行分類處理,得到所述篩選后目標樣本對應(yīng)的第二類別概率分布,所述訓練后深度分類模型的網(wǎng)絡(luò)深度大于預設(shè)分類模型的網(wǎng)絡(luò)深度;
計算所述第二類別概率分布與所述第一類別概率分布之間的差異,并基于所述差異對預設(shè)分類模型進行收斂,得到訓練后分類模型,所述訓練后分類模型用于對待處理信息進行分類。
2.如權(quán)利要求1所述的信息處理方法,其特征在于,所述基于所述困難系數(shù)對所述目標樣本進行篩選,得到篩選后目標樣本,包括:
根據(jù)所述目標樣本的困難系數(shù)對每一目標樣本以由大到小的順序進行排序,得到第一排序結(jié)果;
根據(jù)所述第一排序結(jié)果對滿足預設(shè)條件的目標樣本進行篩選,得到篩選后目標樣本。
3.如權(quán)利要求1所述的信息處理方法,其特征在于,所述根據(jù)所述第一類別概率分布計算所述目標樣本的困難系數(shù),包括:
根據(jù)所述第一類別概率分布獲取每一目標樣本對應(yīng)的每一類別的類別概率;
將每一目標樣本對應(yīng)的每一類別的類別概率以由大到小的順序進行排序,得到第二排序結(jié)果;
根據(jù)所述第二排序結(jié)果確定每一目標樣本對應(yīng)的類別概率中排名最靠前的兩個類別概率;
根據(jù)排名最靠前的兩個類別概率之間的差值確定每一目標樣本的分類間隔差值;
基于所述分類間隔差值確定每一目標樣本的困難系數(shù)。
4.如權(quán)利要求1所述的信息處理方法,其特征在于,所述根據(jù)所述第一類別概率分布計算所述目標樣本的困難系數(shù),包括:
根據(jù)所述第一類別概率分布獲取每一目標樣本對應(yīng)的每一類別的類別概率;
將每一目標樣本對應(yīng)的每一類別的類別概率以由大到小的順序進行排序,得到第三排序結(jié)果;
根據(jù)所述第三排序結(jié)果確定每一目標樣本對應(yīng)的類別概率中排名最靠前的類別概率;
根據(jù)所述排名最靠前的類別概率計算每一目標樣本的混淆分數(shù);
基于所述混淆分數(shù)確定每一目標樣本的困難系數(shù)。
5.如權(quán)利要求1中任一項所述的信息處理方法,其特征在于,所述根據(jù)所述第一類別概率分布計算所述目標樣本的困難系數(shù),包括:
根據(jù)所述第一類別概率分布計算所述目標樣本的熵值;
基于所述熵值確定每一目標樣本的困難系數(shù)。
6.如權(quán)利要求1至5中任一項所述的信息處理方法,其特征在于,所述計算所述第二類別概率分布與所述第一類別概率分布之間的差異,包括:
計算所述第二類別概率分布以及所述第一類別概率分布之間的相對熵;
根據(jù)所述相對熵確定所述第二類別概率分布與所述第一類別概率分布之間的差異。
7.如權(quán)利要求1所述的信息處理方法,其特征在于,所述采用預設(shè)分類模型對所述目標樣本進行分類處理,得到所述目標樣本對應(yīng)的第一類別概率分布之前,還包括:
獲取預設(shè)分類模型和訓練后深度分類模型;
當預設(shè)分類模型與所述訓練后深度分類模型的模型架構(gòu)相同時,獲取預設(shè)分類模型的第一網(wǎng)絡(luò)深度層級數(shù)以及所述訓練后深度分類模型的第二網(wǎng)絡(luò)深度層級數(shù),所述第一網(wǎng)絡(luò)深度層級數(shù)小于所述第二網(wǎng)絡(luò)深度層級數(shù);
將所述訓練后深度分類模型的前第一網(wǎng)絡(luò)深度層級數(shù)的層級的模型參數(shù)確定為預設(shè)分類模型的初始化模型參數(shù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京大學;騰訊科技(深圳)有限公司,未經(jīng)北京大學;騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111031124.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





