[發(fā)明專利]基于查詢的分類器訓(xùn)練方法和裝置有效
| 申請?zhí)枺?/td> | 201710609365.8 | 申請日: | 2017-07-24 |
| 公開(公告)號: | CN110020096B | 公開(公告)日: | 2021-09-07 |
| 發(fā)明(設(shè)計)人: | 馬慶麗 | 申請(專利權(quán))人: | 北京國雙科技有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/9536;G06K9/62;G06Q50/00 |
| 代理公司: | 北京康信知識產(chǎn)權(quán)代理有限責(zé)任公司 11240 | 代理人: | 趙囡囡;褚敏 |
| 地址: | 100083 北京市海淀區(qū)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 查詢 分類 訓(xùn)練 方法 裝置 | ||
1.一種基于查詢的分類器訓(xùn)練方法,其特征在于,包括:
采用LTR算法對查詢訓(xùn)練集訓(xùn)練得到權(quán)重模型以及所述查詢訓(xùn)練集的每個訓(xùn)練樣本分別訓(xùn)練得到排序模型,其中,所述查詢訓(xùn)練集包括多個查詢,所述訓(xùn)練樣本包括至少兩個查詢;
確定所述權(quán)重模型的第一宏平均準(zhǔn)確率以及每個所述排序模型的第二宏平均準(zhǔn)確率;
根據(jù)所述第一宏平均準(zhǔn)確率和所述第二宏平均準(zhǔn)確率確定分類器的增益;
根據(jù)所述增益確定所述分類器;
其中,所述權(quán)重模型為BM25模型。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,使用查詢訓(xùn)練集訓(xùn)練得到權(quán)重模型包括:
使用所述查詢訓(xùn)練集進行所述權(quán)重模型的訓(xùn)練以及使用驗證集進行所述權(quán)重模型參數(shù)的優(yōu)化。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,確定所述權(quán)重模型的第一宏平均準(zhǔn)確率以及每個所述排序模型的第二宏平均準(zhǔn)確率,包括:
根據(jù)測試集確定所述權(quán)重模型的所述第一宏平均準(zhǔn)確率以及根據(jù)所述測試集確定每個所述排序模型的第二宏平均準(zhǔn)確率。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)所述第一宏平均準(zhǔn)確率和所述第二宏平均準(zhǔn)確率確定分類器的增益,包括:
計算所述第一宏平均準(zhǔn)確率和所述第二宏平均準(zhǔn)確率的差值,將所述差值確定為所述分類器的增益。
5.根據(jù)權(quán)利要求1-4中任意一項所述的方法,其特征在于,所述分類器為Logistic回歸函數(shù)。
6.一種基于查詢的分類器訓(xùn)練裝置,其特征在于,包括:
訓(xùn)練模塊,用于采用LTR算法對查詢訓(xùn)練集訓(xùn)練得到權(quán)重模型以及所述查詢訓(xùn)練集的每個訓(xùn)練樣本分別訓(xùn)練得到排序模型,其中,所述查詢訓(xùn)練集包括多個查詢,所述訓(xùn)練樣本包括至少兩個查詢;
第一確定模塊,用于確定所述權(quán)重模型的第一宏平均準(zhǔn)確率以及每個所述排序模型的第二宏平均準(zhǔn)確率;
第二確定模塊,用于根據(jù)所述第一宏平均準(zhǔn)確率和所述第二宏平均準(zhǔn)確率確定分類器的增益;
第三確定模塊,用于根據(jù)所述增益確定所述分類器;
其中,所述權(quán)重模型為BM25模型。
7.一種存儲介質(zhì),其特征在于,所述存儲介質(zhì)包括存儲的程序,其中,在所述程序運行時控制所述存儲介質(zhì)所在設(shè)備執(zhí)行權(quán)利要求1至5中任意一項所述的基于查詢的分類器訓(xùn)練方法。
8.一種處理器,其特征在于,所述處理器用于運行程序,其中,所述程序運行時執(zhí)行權(quán)利要求1至5中任意一項所述的基于查詢的分類器訓(xùn)練方法。
9.一種終端,其特征在于,包括:
訓(xùn)練模塊,用于采用LTR算法對查詢訓(xùn)練集訓(xùn)練得到權(quán)重模型以及所述查詢訓(xùn)練集的每個訓(xùn)練樣本分別訓(xùn)練得到排序模型,其中,所述查詢訓(xùn)練集包括多個查詢,所述訓(xùn)練樣本包括至少兩個查詢;其中,所述權(quán)重模型為BM25模型;
第一確定模塊,用于確定所述權(quán)重模型的第一宏平均準(zhǔn)確率以及每個所述排序模型的第二宏平均準(zhǔn)確率;
第二確定模塊,用于根據(jù)所述第一宏平均準(zhǔn)確率和所述第二宏平均準(zhǔn)確率確定分類器的增益;
第三確定模塊,用于根據(jù)所述增益確定所述分類器;
處理器,所述處理器運行程序,其中,所述程序運行時對于從所述訓(xùn)練模塊、所述第一確定模塊、所述第二確定模塊和所述第三確定模塊輸出的數(shù)據(jù)執(zhí)行權(quán)利要求1至5中任意一項所述的基于查詢的分類器訓(xùn)練方法。
10.一種終端,其特征在于,包括:
訓(xùn)練模塊,用于采用LTR算法對查詢訓(xùn)練集訓(xùn)練得到權(quán)重模型以及所述查詢訓(xùn)練集的每個訓(xùn)練樣本分別訓(xùn)練得到排序模型,其中,所述查詢訓(xùn)練集包括多個查詢,所述訓(xùn)練樣本包括至少兩個查詢;其中,所述權(quán)重模型為BM25模型;
第一確定模塊,用于確定所述權(quán)重模型的第一宏平均準(zhǔn)確率以及每個所述排序模型的第二宏平均準(zhǔn)確率;
第二確定模塊,用于根據(jù)所述第一宏平均準(zhǔn)確率和所述第二宏平均準(zhǔn)確率確定分類器的增益;
第三確定模塊,用于根據(jù)所述增益確定所述分類器;
存儲介質(zhì),用于存儲程序,其中,所述程序在運行時對于從所述訓(xùn)練模塊、所述第一確定模塊、所述第二確定模塊和所述第三確定模塊輸出的數(shù)據(jù)執(zhí)行權(quán)利要求1至5中任意一項所述的基于查詢的分類器訓(xùn)練方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京國雙科技有限公司,未經(jīng)北京國雙科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710609365.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





