[發明專利]一種數據模型處理方法及其裝置有效
| 申請號: | 201710154285.8 | 申請日: | 2017-03-15 |
| 公開(公告)號: | CN108629351B | 公開(公告)日: | 2022-05-13 |
| 發明(設計)人: | 劉克俊 | 申請(專利權)人: | 騰訊科技(北京)有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京派特恩知識產權代理有限公司 11270 | 代理人: | 蔣雅潔;李梅香 |
| 地址: | 100080 北京市海淀區海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據模型 處理 方法 及其 裝置 | ||
本發明實施例公開了一種數據模型處理方法,所述方法包括:確定待處理數據,從所述待處理數據中提取出至少一個第一特征信息;基于所述至少一個第一特征信息,選取出具有至少兩個第二特征信息的第一模型,其中,所述至少兩個第二特征信息與所述至少一個第一特征信息至少部分相同;對所述第一模型中至少兩個第二特征信息進行組合處理,得到至少一個目標特征信息,基于所述待處理數據確定出所述至少一個目標特征信息的權重,根據確定出的權重以及所述至少一個目標特征信息得到第二模型。本發明實施例還公開了一種數據模型處理裝置。
技術領域
本發明涉及數據處理技術,尤其涉及一種數據模型處理方法及其裝置。
背景技術
在邏輯回歸模型訓練場景中,經常會面臨新的應用場景所能提供的訓練數據較少的情況,比如,在展示廣告場景下,新廣告位展示數據非常少時,無法直接進行模型訓練,但其它廣告位展示數據相對充分且已訓練得到數據模型,此時,若直接利用其他應用場景的訓練數據得到的數據模型對新應用場景中的訓練數據進行訓練,會出現數據訓練不充分,訓練結果誤差較大的問題。
發明內容
為解決現有存在的技術問題,本發明實施例提供了一種數據模型處理方法及其裝置,能至少解決現有技術中存在的上述問題。
本發明實施例的技術方案是這樣實現的:
本發明實施例第一方面提供了一種數據模型處理方法,所述方法包括:
確定待處理數據,從所述待處理數據中提取出至少一個第一特征信息;
基于所述至少一個第一特征信息,選取出具有至少兩個第二特征信息的第一模型,其中,所述至少兩個第二特征信息與所述至少一個第一特征信息至少部分相同;
對所述第一模型中至少兩個第二特征信息進行組合處理,得到至少一個目標特征信息;
基于所述待處理數據確定出所述至少一個目標特征信息的權重,根據確定出的權重以及所述至少一個目標特征信息得到第二模型。
上述方案中,所述對所述第一模型中至少兩個第二特征信息進行組合處理,得到至少一個目標特征信息,包括:
獲取所述至少兩個第二特征信息在所述第一模型中對應的權重;
對所述第一模型中至少兩個第二特征信息進行組合處理,得到至少一個目標特征信息,以使根據所述至少一個目標特征信息得到的第二模型中目標特征信息的個數少于所述第一模型中第二特征信息的個數;
其中,所述第二模型中每一所述目標特征信息均能表征自身所包含的第二特征信息,以及所包含的第二特征信息在所述第一模型中的權重。
上述方案中,所述對所述第一模型中至少兩個第二特征信息進行組合處理,得到至少一個目標特征信息,包括:
從所述至少兩個第二特征信息中選取出具有關聯關系的第二特征信息,將具有關聯關系的第二特征信息進行組合,得到至少一個目標特征信息;和/或,
從所述至少兩個第二特征信息中選取出與每一所述第一特征信息具有關聯的第二特征信息,將與每一所述第一特征信息具有關聯關系的所有第二特征信息進行組合,得到至少一個目標特征信息。
上述方案中,所述基于所述至少一個第一特征信息,選取出具有至少兩個第二特征信息的第一模型,包括:
確定所述待處理數據的目標應用場景;
根據所述待處理數據的目標應用場景以及所述至少一個第一特征信息,選取出具有至少兩個第二特征信息的第一模型,以使選取出的第一模型所對應的應用場景與所述目標應用場景相關聯,使所述至少兩個第二特征信息與所述至少一個第一特征信息至少部分相同;對應地,
所述第二模型能夠用于對所述目標應用場景的其他待處理數據進行數據分析。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(北京)有限公司,未經騰訊科技(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710154285.8/2.html,轉載請聲明來源鉆瓜專利網。





