[發明專利]一種識別模型的確定方法和裝置有效
| 申請號: | 201811360817.4 | 申請日: | 2018-11-15 |
| 公開(公告)號: | CN109685104B | 公開(公告)日: | 2022-05-13 |
| 發明(設計)人: | 范芳芳 | 申請(專利權)人: | 同盾控股有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 莎日娜 |
| 地址: | 311121 浙江省杭州市余*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 識別 模型 確定 方法 裝置 | ||
本申請實施例提供了一種識別模型的確定方法和裝置,該方法包括:獲取待訓練數據和待測試數據,該待訓練數據和待測試數據均包括C個類別的數據;根據N個學習模型和待訓練數據,利用Stacking模型融合策略對待訓練數據和待測試數據進行概率預測,以確定特征數據集;根據特征數據集,對Fisher判別模型進行訓練,以確定C?1維的判別函數模型;通過預設的模型評估指標,輸出目標識別模型,該目標識別模型是符合預設的模型評估條件的判別函數模型。能夠解決人機識別的問題,提升識別模型的識別率以及泛化能力。
技術領域
本申請涉及人機識別技術領域,特別是涉及一種識別模型的確定方法和裝置。
背景技術
在互聯網領域,隨著機器學習技術的發展,為用戶提供了各種豐富多彩的體驗,但隨之帶來了網絡安全問題,因此產生了人機識別技術,現有技術中,普遍采用傳統的機器學習算法進行人機識別,且是二分類識別。目前所采用的人機識別模型都是對不同的平臺,例如分別針對各個電商公司訓練針對這個平臺的一個單分類器,由于每個平臺都有自己的特性,且有些平臺所產生的數據不全,例如小電商公司由于設備、環境、人員等條件,獲取到的數據不完備,這樣則會導致一些平臺無法訓練模型,一些平臺所訓練出的模型效果差。
發明內容
鑒于上述問題,本申請實施例提供一種識別模型的確定方法,能夠解決現有技術在人機識別的存在的數據不全或者模型效果差的問題。
相應的,本申請實施例還提供了一種識別模型的確定裝置,用以保證上述方法的實現及應用。
為了解決上述問題,本申請實施例公開了一種識別模型的確定方法,所述方法包括:
獲取待訓練數據和待測試數據,所述待訓練數據和所述待測試數據均包括C個類別的數據;
根據N個學習模型和所述待訓練數據,利用Stacking模型融合策略對所述待訓練數據和所述待測試數據進行概率預測,以確定特征數據集,所述N個學習模型是基于Lp-Lq混合范數的稀疏線性稀疏多核多任務學習算法框架利用多個多任務學習算法根據所述待訓練數據中的第一訓練集數據訓練得到的包括至少一個多任務學習模型和至少一個單任務學習模型;
根據所述特征數據集,對Fisher判別模型進行訓練,以確定C-1維的判別函數模型;
通過預設的模型評估指標,確定目標識別模型,所述目標識別模型是符合預設的模型評估條件的所述判別函數模型。
相應的,本申請實施例還公開了一種識別模型的確定裝置,所述裝置包括:
數據獲取模塊,用于獲取待訓練數據和待測試數據,所述待訓練數據和所述待測試數據均包括C個類別的數據;
概率預測模塊,用于根據N個學習模型和所述待訓練數據,利用Stacking模型融合策略對所述待訓練數據和所述待測試數據進行概率預測,以確定特征數據集,所述N個學習模型是基于Lp-Lq混合范數的稀疏線性稀疏多核多任務學習算法框架利用多個多任務學習算法根據所述待訓練數據中的第一訓練集數據訓練得到的包括至少一個多任務學習模型和至少一個單任務學習模型;
模型訓練模塊,用于根據所述特征數據集,對Fisher判別模型進行訓練,以確定C-1維的判別函數模型;
模型輸出模塊,用于通過預設的模型評估指標,確定目標識別模型,所述目標識別模型是符合預設的模型評估條件的所述判別函數模型。
本申請實施例還提供一種裝置,包括處理器以及存儲器,其中,
所述處理器執行所述存儲器所存放的計算機程序代碼,以實現本申請所述的識別模型的確定方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于同盾控股有限公司,未經同盾控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811360817.4/2.html,轉載請聲明來源鉆瓜專利網。





