[發(fā)明專利]基于小樣本擴(kuò)展的互聯(lián)網(wǎng)服務(wù)提供方法、裝置及電子設(shè)備在審
| 申請?zhí)枺?/td> | 202110799822.0 | 申請日: | 2021-07-15 |
| 公開(公告)號: | CN113569929A | 公開(公告)日: | 2021-10-29 |
| 發(fā)明(設(shè)計(jì))人: | 李達(dá);丁楠;蘇綏綏 | 申請(專利權(quán))人: | 北京淇瑀信息科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06F16/958 |
| 代理公司: | 北京清誠知識產(chǎn)權(quán)代理有限公司 11691 | 代理人: | 宋紅艷 |
| 地址: | 100012 北京市朝陽*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 樣本 擴(kuò)展 互聯(lián)網(wǎng) 服務(wù) 提供 方法 裝置 電子設(shè)備 | ||
1.一種基于小樣本擴(kuò)展的互聯(lián)網(wǎng)服務(wù)提供方法,其特征在于,所述方法包括:
基于第一樣本數(shù)據(jù)和小樣本數(shù)據(jù)的共享特征生成具有標(biāo)簽的混合樣本,所述標(biāo)簽用于標(biāo)識數(shù)據(jù)來源于所述第一樣本數(shù)據(jù)還是來源于所述小樣本數(shù)據(jù);
采用第一比例的混合樣本訓(xùn)練二分類模型;
將剩余混合樣本輸入訓(xùn)練好的二分類模型中得到預(yù)測值;
根據(jù)所述預(yù)測值從第一樣本數(shù)據(jù)中提取目標(biāo)樣本數(shù)據(jù)對小樣本數(shù)據(jù)進(jìn)行擴(kuò)展;
采用擴(kuò)展后的小樣本數(shù)據(jù)訓(xùn)練預(yù)設(shè)互聯(lián)網(wǎng)服務(wù)的預(yù)設(shè)模型;
根據(jù)訓(xùn)練后的預(yù)設(shè)模型處理所述預(yù)設(shè)互聯(lián)網(wǎng)服務(wù)的指定任務(wù)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于第一樣本數(shù)據(jù)和小樣本數(shù)據(jù)的共享特征生成具有標(biāo)簽的混合樣本包括:
根據(jù)所述第一樣本數(shù)據(jù)和所述小樣本數(shù)據(jù)的任務(wù)類型確定共享特征;
從第一樣本數(shù)據(jù)中抽取共享特征打上第一標(biāo)簽,并從所述小樣本數(shù)據(jù)上抽取共享特征打上第二標(biāo)簽,生成混合樣本。
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述根據(jù)所述預(yù)測值從第一樣本數(shù)據(jù)中提取目標(biāo)樣本數(shù)據(jù)對小樣本數(shù)據(jù)進(jìn)行擴(kuò)展包括:
對所述預(yù)測值進(jìn)行分箱處理,得到N個(gè)分箱;
根據(jù)每個(gè)分箱中的預(yù)測值確定閾值分箱;
根據(jù)所述閾值分箱確定閾值;
將所有第一樣本數(shù)據(jù)輸入訓(xùn)練好的二分類模型中,得到預(yù)測結(jié)果,并根據(jù)所述預(yù)測結(jié)果及所述閾值從第一樣本數(shù)據(jù)中提取目標(biāo)樣本數(shù)據(jù)對小樣本數(shù)據(jù)進(jìn)行擴(kuò)展。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,計(jì)算每個(gè)分箱中小樣本數(shù)據(jù)累計(jì)占比與第一本數(shù)據(jù)累計(jì)占比之差的絕對值,再將最大絕對值對應(yīng)的分箱作為閾值分箱。
5.根據(jù)權(quán)利要求2-4任一項(xiàng)所述的方法,其特征在于,所述任務(wù)類型為風(fēng)險(xiǎn)設(shè)備識別,所述共享特征包括:登陸時(shí)間、資源配額認(rèn)證時(shí)間中的至少一種。
6.根據(jù)權(quán)利要求3或4所述的方法,其特征在于,采用等頻分箱的方式對所述預(yù)測值進(jìn)行分箱處理。
7.根據(jù)權(quán)利要求1-6任一項(xiàng)所述的方法,其特征在于,該方法用于基于第一樣本數(shù)據(jù)擴(kuò)展H5頁面的互聯(lián)網(wǎng)服務(wù)產(chǎn)生的小樣本數(shù)據(jù),所述預(yù)設(shè)模型包括基于H5頁面的預(yù)設(shè)模型;
所述指定任務(wù)為處理H5頁面的互聯(lián)網(wǎng)服務(wù)的指定任務(wù)。
8.一種基于小樣本擴(kuò)展的互聯(lián)網(wǎng)服務(wù)提供裝置,其特征在于,所述裝置包括:
生成模塊,用于基于第一樣本數(shù)據(jù)和小樣本數(shù)據(jù)的共享特征生成具有標(biāo)簽的混合樣本,所述標(biāo)簽用于標(biāo)識數(shù)據(jù)來源于所述第一樣本數(shù)據(jù)還是來源于所述小樣本數(shù)據(jù);
第一訓(xùn)練模塊,用于采用第一比例的混合樣本訓(xùn)練二分類模型;
輸入模塊,用于將剩余混合樣本輸入訓(xùn)練好的二分類模型中得到預(yù)測值;
提取模塊,用于根據(jù)所述預(yù)測值從第一樣本數(shù)據(jù)中提取目標(biāo)樣本數(shù)據(jù)對小樣本數(shù)據(jù)進(jìn)行擴(kuò)展;
第二訓(xùn)練模塊,用于采用擴(kuò)展后的小樣本數(shù)據(jù)訓(xùn)練預(yù)設(shè)互聯(lián)網(wǎng)服務(wù)的預(yù)設(shè)模型;
處理模塊,用于根據(jù)訓(xùn)練后的預(yù)設(shè)模型處理所述預(yù)設(shè)互聯(lián)網(wǎng)服務(wù)的指定任務(wù)。
9.一種電子設(shè)備,包括:
處理器;以及
存儲(chǔ)計(jì)算機(jī)可執(zhí)行指令的存儲(chǔ)器,所述計(jì)算機(jī)可執(zhí)行指令在被執(zhí)行時(shí)使所述處理器執(zhí)行根據(jù)權(quán)利要求1-7中任一項(xiàng)所述的方法。
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其中,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)一個(gè)或多個(gè)程序,當(dāng)所述一個(gè)或多個(gè)程序被處理器執(zhí)行時(shí),實(shí)現(xiàn)權(quán)利要求1-7中任一項(xiàng)所述的方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京淇瑀信息科技有限公司,未經(jīng)北京淇瑀信息科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110799822.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 基于網(wǎng)絡(luò)電視的互聯(lián)網(wǎng)業(yè)務(wù)處理方法和系統(tǒng)
- 互聯(lián)網(wǎng)業(yè)務(wù)接入網(wǎng)關(guān)的實(shí)現(xiàn)方法和系統(tǒng)
- 一種互聯(lián)網(wǎng)電視終端安全訪問互聯(lián)網(wǎng)的方法
- 一種互聯(lián)網(wǎng)應(yīng)用交互方法、裝置及系統(tǒng)
- 一種使用互聯(lián)網(wǎng)移動(dòng)攝像終端進(jìn)行異地圖像拍攝的系統(tǒng)
- 一種網(wǎng)絡(luò)電視終端安全訪問互聯(lián)網(wǎng)的方法
- 利用區(qū)塊鏈保護(hù)用于互聯(lián)網(wǎng)資源分配的事務(wù)
- 互聯(lián)網(wǎng)廣告裝置及方法
- 中央管理服務(wù)器的互聯(lián)網(wǎng)連接方法及系統(tǒng)
- 互聯(lián)網(wǎng)節(jié)點(diǎn)中信任傳播方法、系統(tǒng)及相關(guān)產(chǎn)品





