[發明專利]一種標簽預測方法、裝置及存儲介質有效
| 申請號: | 201711480729.3 | 申請日: | 2017-12-29 |
| 公開(公告)號: | CN108090216B | 公開(公告)日: | 2021-02-05 |
| 發明(設計)人: | 羅元帥 | 申請(專利權)人: | 咪咕文化科技有限公司;中國移動通信集團公司 |
| 主分類號: | G06F16/955 | 分類號: | G06F16/955;G06F16/35;G06K9/62 |
| 代理公司: | 北京派特恩知識產權代理有限公司 11270 | 代理人: | 王姍姍;張穎玲 |
| 地址: | 100032 北京市西城區德*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 標簽 預測 方法 裝置 存儲 介質 | ||
本發明公開了一種標簽預測方法,包括:確定分類模型中各決策樹的投票權重值,其中,包括核屬性的決策樹的投票權重值,高于不包括所述核屬性的決策樹的投票權重值;根據所述各決策樹的投票權重值,確定與待預測文本信息對應的各類別標簽的投票得分;基于所述各類別標簽的投票得分,選取投票得分符合預設條件的類別標簽,將所述符合預設條件的類別標簽作為與所述待預測文本信息相關聯的預測標簽。本發明還同時公開了一種標簽預測裝置、以及存儲介質。
技術領域
本發明涉及人工智能領域中的數據處理技術,尤其涉及一種標簽預測方法、裝置及存儲介質。
背景技術
隨著互聯網和終端技術的不斷發展,人們可以通過網絡平臺或移動終端閱讀各種類型的文本信息,如電子圖書、網絡新聞等。目前大都采用標簽對文本信息進行分類標示。由于標簽與文本信息之間的相關性很強,因此,利用標簽可以對文本信息進行簡單描述和分類,以便用戶檢索或查找感興趣的文本信息。
目前,為了給文本信息設置標簽,一般采用的技術實現方案是:當文本信息的數據規模較小時,通常采用人工標記的方式,即用戶手動操作給文本信息設置標簽。然而,當文本信息的數據規模較大時,若仍采用人工標記的方式,則工作量較大,效率低下。因此,相關技術中會通過算法來對文本信息進行標簽預測,例如采用隨機森林(Random Frost)算法進行標簽預測,但是,相關技術中的隨機森林算法在進行標簽預測時,準確度也不高。
發明內容
有鑒于此,本發明實施例期望提供一種標簽預測方法、裝置及存儲介質,至少用以解決相關技術難以有效提高標簽預測的準確度的問題。
為達到上述目的,本發明實施例的技術方案是這樣實現的:
第一方面,本發明實施例提供一種標簽預測方法,所述方法包括:
確定分類模型中各決策樹的投票權重值;其中,包括核屬性的決策樹的投票權重值,高于不包括所述核屬性的決策樹的投票權重值;
根據所述各決策樹的投票權重值,確定與待預測文本信息對應的各類別標簽的投票得分;
基于所述各類別標簽的投票得分,選取投票得分符合預設條件的類別標簽,將所述符合預設條件的類別標簽作為與所述待預測文本信息相關聯的預測標簽。
第二方面,本發明實施例提供一種標簽預測裝置,所述裝置包括:第一確定模塊、第二確定模塊和選取模塊;其中,
所述第一確定模塊,用于確定分類模型中各決策樹的投票權重值;其中,包括核屬性的決策樹的投票權重值,高于不包括所述核屬性的決策樹的投票權重值;
所述第二確定模塊,用于根據所述各決策樹的投票權重值,確定與待預測文本信息對應的各類別標簽的投票得分;
所述選取模塊,用于基于所述各類別標簽的投票得分,選取投票得分符合預設條件的類別標簽,將所述符合預設條件的類別標簽作為與所述待預測文本信息相關聯的預測標簽。
第三方面,本發明實施例提供一種存儲介質,其上存儲有可執行程序,所述可執行程序被處理器執行時實現本發明實施例提供的標簽預測方法的步驟。
第四方面,本發明實施例還提供一種標簽預測裝置,包括存儲器、處理器及存儲在存儲器上并能夠由所述處理器運行的可執行程序,所述處理器運行所述可執行程序時執行本發明實施例提供的標簽預測方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于咪咕文化科技有限公司;中國移動通信集團公司,未經咪咕文化科技有限公司;中國移動通信集團公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711480729.3/2.html,轉載請聲明來源鉆瓜專利網。





