[發明專利]文本分類模型調優的超參數推薦方法、裝置及存儲介質有效
| 申請號: | 202110496595.4 | 申請日: | 2021-05-07 |
| 公開(公告)號: | CN113220993B | 公開(公告)日: | 2023-09-26 |
| 發明(設計)人: | 郝天永;雷順威;瞿瑛瑛 | 申請(專利權)人: | 華南師范大學 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/35;G06N3/0464;G06N3/08 |
| 代理公司: | 廣州嘉權專利商標事務所有限公司 44205 | 代理人: | 黎揚鵬 |
| 地址: | 510631 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 分類 模型 參數 推薦 方法 裝置 存儲 介質 | ||
1.一種文本分類模型調優的超參數推薦方法,其特征在于,包括:
根據文本分類模型的超參數類型,構建超參數組集;
根據所述文本分類模型的類別體系與分類性能指標,計算得到第一組數據,所述第一組數據包括類別體系權重信息和總體分類性能指標權重信息;
根據所述超參數組集,對所述文本分類模型進行訓練與測試,得到第二組數據,所述第二組數據包括總體分類性能結果和類目分類性能結果集;
根據所述第一組數據,對所述第二組數據進行計算,得到第三組數據,所述第三組數據包括總體分類性能綜合結果和類目分類性能綜合結果;
對所述第三組數據進行排序,得到推薦的超參數組;
所述分類性能指標包括準確率、精準率、召回率、F值中的至少一種,所述根據所述文本分類模型的類別體系與分類性能指標,計算得到第一組數據這一步驟,包括:
獲取所述文本分類模型的類別體系的集合為第一集合Y={y1,...,yi,...,yn};
構建第一判斷矩陣,所述第一判斷矩陣為n階判斷矩陣B=(bij)n×n,其中bij表示類別yi對類別yj的相對重要程度;
對所述第一判斷矩陣B的每一列進行歸一化處理,得到第二判斷矩陣B′=(bij′)n×n;
其中,所述對所述構建的判斷矩陣B的每一列進行歸一化處理滿足
對所述第二判斷矩陣B′按列相加,得到第一特征向量W′=(W1′,...,Wi′,...,Wn′)T;
對所述第一特征向量W′進行歸一化處理,得到第二特征向量W=(W1,...,Wi,...,Wn)T;
其中,所述對所述第一特征向量W′進行歸一化處理滿足
若所述第一集合的元素數量n大于第一預設值,根據所述第一判斷矩陣B和所述第二特征向量W,計算得到所述第一判斷矩陣B的最大特征根λmax;
其中,所述最大特征根滿足
根據所述最大特征根λmax,計算所述第一判斷矩陣B的一致性指標CI;
若所述第一集合的元素數量n小于第二預設值,根據平均隨機一致性指標表格,查詢所述第一判斷矩陣B對應的平均隨機一致性指標RI;
根據所述一致性指標CI和所述平均隨機一致性指標RI,計算得到所述第一判斷矩陣的一致性比率CR;
若所述一致性比率CR小于第三預設值,根據所述第二特征向量W=(W1,...,Wi,...,Wn)T,計算得到所述第一集合對應的權重集合w=(w1,...,wi,...,wn),所述權重集合為所述類別體系權重信息;
獲取分類性能指標集為第二集合M={m1,...,mj,...,mn};
若所述F值在所述第二集合中,則執行以下步驟:
判斷所述精準率和所述召回率是否在所述第二集合M中,若在,將所述精準率和所述召回率從所述第二集合M中移除;
計算所述召回率R相對于所述精準率P的相對重要程度β′;
對所述相對重要程度β′進行歸一化處理,得到所述召回率R相對于所述精準率P的權重系數β;
根據所述精準率P、所述召回率R和所述權重系數β,計算得到帶有權重的F值;
其中,所述帶有權重的F值滿足
若所述F值不在所述第二集合M中,則按照所述類別體系權重信息的獲取方法,獲取得到所述第二集合對應的總體分類性能指標權重集合z=(z1,...,zj,...,zn),所述總體分類性能指標權重集合為所述總體分類性能指標權重信息;
若所述第一集合的元素數量n大于第二預設值,通過以下方式獲取得到所述平均隨機一致性指標;
構建n階隨機正互反矩陣A′;
計算所述n階隨機正互反矩陣的最大特征根的平均值,得到所述平均隨機一致性指標RI;
所述根據所述第一組數據,對所述第二組數據進行計算,得到第三組數據這一步驟,包括:
根據所述總體分類性能指標權重信息,對所述總體分類性能結果進行計算,得到所述總體分類性能綜合結果;
根據所述類別體系權重信息,對所述類目分類性能結果集進行計算,得到所述類目分類性能綜合結果;
總體分類性能綜合結果的獲取過程為:
(1)獲取分類性能指標M={m1,...,mj,...,mn},各超參數組的文本分類模型的總體分類性能結果為St={st1,...,stj,...,stn},各超參數組的文本分類模型的總體分類性能指標權重集合為z=(z1,...,zj,...,zn);
(2)計算文本分類模型的總體分類性能綜合結果為
類目分類性能綜合結果的獲取過程為:
(1)獲取類別集合Y={y1,...,yi,...,yn},各超參數組的文本分類模型的類目分類性能結果集為Sc={Sc1,...,Sci,...,Scn},其中Sci={s′c1,...,s′cj,...,s′cn}表示類別yi的分類性能結果集,類別集合Y的權重集合w=(w1,...,wi,...,wn);
(2)計算文本分類模型的類目分類性能綜合結果為
對所述第三組數據進行排序,得到推薦的超參數組這一步驟,包括:
對所述超參數組集中各個超參數組的總體分類性能綜合結果與類目分類性能綜合結果進行標準化并相加,得到最終分類性能綜合結果;
對所述最終分類性能綜合結果進行排序,得到推薦超參數組;
(1)對總體分類性能綜合結果進行標準化
(2)對所述類目分類性能綜合結果進行標準化
(3)對各所述超參數組的標準化后的總體分類性能結果和類目分類性能結果進行相加,得到最終分類性能綜合結果R=Rt+Rc。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南師范大學,未經華南師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110496595.4/1.html,轉載請聲明來源鉆瓜專利網。





