[發明專利]行業分類模型訓練、使用方法、裝置、設備及介質在審
| 申請號: | 202011278739.0 | 申請日: | 2020-11-16 |
| 公開(公告)號: | CN112417150A | 公開(公告)日: | 2021-02-26 |
| 發明(設計)人: | 羅奕康;聶砂;白彧斐;賈國琛;鄭江 | 申請(專利權)人: | 建信金融科技有限責任公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06K9/62 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 200120 上海市浦東新區中國(*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 行業 分類 模型 訓練 使用方法 裝置 設備 介質 | ||
本發明實施例公開了一種行業分類模型的訓練、使用方法、裝置、設備及介質。所述方法包括:基于行業分類標準的層級關系,將各級分類行業向所屬二級分類行業的行業分類標簽進行映射,得到行業分類訓練數據樣本;采用行業分類訓練數據樣本以及所述行業分類訓練數據樣本中包括的行業分類標簽,對預設行業分類模型進行有監督訓練,得到目標行業分類模型。采用本申請方案,通過行業分類標準自帶的層級關系來構建訓練樣本進行模型訓練,可以實現不依賴任何標注數據,完成短文本、多標簽文本的行業分類模型訓練,且保證訓練的模型能準確識別出公文短文本中的受眾行業分類結果。
技術領域
本發明實施例涉及自然語音處理技術領域,尤其涉及一種行業分類模型的訓練、使用方法、裝置、設備及介質。
背景技術
隨著經濟的不斷發展,針對各行各業推出了相應地慧企利民政策,在公布各種慧企利民政策后通常需要進行政策與個體、企業之間的匹配,實現精準推送政策,達到政策找人的目的。然而,相關技術中,通常是采用人工分類的方式對各類慧企利民政策進行行業匹配,雖然能夠保證行業匹配的準確性,但是由于效率低下,缺乏實用性;如果采用傳統機器學習的文本分類辦法對政策進行分類,通常需要針對每一個行業標注大量數據,而政策公文文本往往伴隨著數量少、文本包含分類多的特點,造成人工標注工作十分困難。因此,如何實現快速有效地對政策進行行業匹配變得尤為重要。
發明內容
本發明實施例中提供了一種行業分類模型的訓練、使用方法、裝置、設備及介質,以實現對各種公文政策快速準確地適配行業。
第一方面,本發明實施例中提供了一種行業分類模型的訓練方法,所述方法包括:
基于行業分類標準的層級關系,將各級分類行業向所屬二級分類行業的行業分類標簽進行映射,得到行業分類訓練數據樣本;
采用行業分類訓練數據樣本以及所述行業分類訓練數據樣本中包括的行業分類標簽,對預設行業分類模型進行有監督訓練,得到目標行業分類模型。
第二方面,本發明實施例中還提供了一種行業分類模型的使用方法,所述行業分類模型采用本申請實施例中行業分類模型的訓練方法獲得,所述使用方法包括:
從公文文本信息中得到一組文本輸入序列;
將所述一組文本輸入序列輸入到所述行業分類模型中,通過所述行業分類模型輸出對應的CLS特征向量輸出序列;
依據所述CLS特征向量輸出序列,確定與所述公文文本信息匹配的二級行業分類結果。
第三方面,本發明實施例中還提供了一種行業分類模型的訓練裝置,所述裝置包括:
樣本獲取模塊,用于基于行業分類標準的層級關系,將各級分類行業向所屬二級分類行業的行業分類標簽進行映射,得到行業分類訓練數據樣本;
模型訓練模塊,用于采用行業分類訓練數據樣本以及所述行業分類訓練數據樣本中包括的行業分類標簽,對預設行業分類模型進行有監督訓練,得到目標行業分類模型。
第四方面,本發明實施例中還提供了一種行業分類模型的使用裝置,其特征在于,所述行業分類模型采采用本申請實施例中行業分類模型的訓練方法獲得,所述裝置包括:
輸入模塊,用于從公文文本信息中得到一組文本輸入序列;
輸出模塊,用于將所述一組文本輸入序列輸入到所述行業分類模型中,通過所述行業分類模型輸出對應的CLS特征向量輸出序列;
分類模塊,用于依據所述CLS特征向量輸出序列,確定與所述公文文本信息匹配的二級行業分類結果。
第五方面,本發明實施例中還提供了一種電子設備,包括:
一個或多個處理裝置;
存儲裝置,用于存儲一個或多個程序;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于建信金融科技有限責任公司,未經建信金融科技有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011278739.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:強化學習方法、裝置、電子設備和存儲介質
- 下一篇:一種干式智能管道壓力檢測儀





