[發明專利]一種標簽預測方法、裝置及存儲介質有效
| 申請號: | 201711480729.3 | 申請日: | 2017-12-29 |
| 公開(公告)號: | CN108090216B | 公開(公告)日: | 2021-02-05 |
| 發明(設計)人: | 羅元帥 | 申請(專利權)人: | 咪咕文化科技有限公司;中國移動通信集團公司 |
| 主分類號: | G06F16/955 | 分類號: | G06F16/955;G06F16/35;G06K9/62 |
| 代理公司: | 北京派特恩知識產權代理有限公司 11270 | 代理人: | 王姍姍;張穎玲 |
| 地址: | 100032 北京市西城區德*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 標簽 預測 方法 裝置 存儲 介質 | ||
1.一種標簽預測方法,其特征在于,所述方法包括:
確定分類模型中各決策樹的投票權重值;其中,包括核屬性的決策樹的投票權重值,高于不包括所述核屬性的決策樹的投票權重值;
根據所述各決策樹的投票權重值,確定與待預測文本信息對應的各類別標簽的投票得分;
基于所述各類別標簽的投票得分,選取投票得分符合預設條件的類別標簽,將所述符合預設條件的類別標簽作為與所述待預測文本信息相關聯的預測標簽;
所述確定分類模型中各決策樹的投票權重值包括:
檢測各決策樹中包括的核屬性的數量;
當所述核屬性的數量小于預設閾值時,采用第一權重計算子策略計算所述決策樹的投票權重值;
所述采用第一權重計算子策略計算所述決策樹的投票權重值,包括:統計所述決策樹中包括核屬性的路徑數量和所述決策樹中的總路徑數量;計算所述決策樹中包括核屬性的路徑數量,與所述決策樹中的總路徑數量的比值,獲得第一比值結果;根據所述第一比值結果,確定所述決策樹的投票權重值;
或者,當所述核屬性的數量大于或等于所述預設閾值時,采用第二權重計算子策略計算所述決策樹的投票權重值;
所述采用第二權重計算子策略計算所述決策樹的投票權重值,包括:計算所述決策樹中各路徑的投票權重值,并統計所述決策樹中的總路徑數量;對所述各路徑的投票權重值進行求和,獲得求和后的結果,將所述求和后的結果與所述決策樹中的總路徑數量的比值,作為所述決策樹的投票權重值;
所述計算所述決策樹中各路徑的投票權重值,包括:統計所述決策樹的各路徑中包括的核屬性的數量,以及對應每條路徑下的總結點數量;計算所述各路徑中包括的核屬性的數量,與對應路徑下的總結點數量的比值,獲得第二比值結果;根據所述第二比值結果,確定所述決策樹中各路徑的投票權重值。
2.根據權利要求1所述的標簽預測方法,其特征在于,所述方法還包括:
確定構建各決策樹的訓練樣本的核屬性;
將包括所述核屬性的決策樹的投票權重值,設置為高于不包括所述核屬性的決策樹的投票權重值。
3.一種標簽預測裝置,其特征在于,所述裝置包括:第一確定模塊、第二確定模塊和選取模塊;其中,
所述第一確定模塊,用于確定分類模型中各決策樹的投票權重值;其中,包括核屬性的決策樹的投票權重值,高于不包括所述核屬性的決策樹的投票權重值;
所述第二確定模塊,用于根據所述各決策樹的投票權重值,確定與待預測文本信息對應的各類別標簽的投票得分;
所述選取模塊,用于基于所述各類別標簽的投票得分,選取投票得分符合預設條件的類別標簽,將所述符合預設條件的類別標簽作為與所述待預測文本信息相關聯的預測標簽;
所述第一確定模塊,用于當所述核屬性的數量小于預設閾值時,統計所述決策樹中包括核屬性的路徑數量和所述決策樹中的總路徑數量;計算所述決策樹中包括核屬性的路徑數量,與所述決策樹中的總路徑數量的比值,獲得第一比值結果;根據所述第一比值結果,確定所述決策樹的投票權重值;或者,當所述核屬性的數量大于或等于所述預設閾值時,計算所述決策樹中各路徑的投票權重值,并統計所述決策樹中的總路徑數量;對所述各路徑的投票權重值進行求和,獲得求和后的結果,將所述求和后的結果與所述決策樹中的總路徑數量的比值,作為所述決策樹的投票權重值;
所述第一確定模塊,具體用于統計所述決策樹的各路徑中包括的核屬性的數量,以及對應每條路徑下的總結點數量;計算所述各路徑中包括的核屬性的數量,與對應路徑下的總結點數量的比值,獲得第二比值結果;根據所述第二比值結果,確定所述決策樹中各路徑的投票權重值。
4.根據權利要求3所述的標簽預測裝置,其特征在于,所述第一確定模塊,具體用于:
確定構建各決策樹的訓練樣本的核屬性;
將包括所述核屬性的決策樹的投票權重值,設置為高于不包括所述核屬性的決策樹的投票權重值。
5.一種存儲介質,其上存儲有可執行程序,其特征在于,所述可執行程序被處理器執行時實現如權利要求1至2任一項所述的標簽預測方法的步驟。
6.一種標簽預測裝置,包括存儲器、處理器及存儲在存儲器上并能夠由所述處理器運行的可執行程序,其特征在于,所述處理器運行所述可執行程序時執行如權利要求1至2任一項所述的標簽預測方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于咪咕文化科技有限公司;中國移動通信集團公司,未經咪咕文化科技有限公司;中國移動通信集團公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711480729.3/1.html,轉載請聲明來源鉆瓜專利網。





