[發(fā)明專利]模型訓練、詞條分類方法、裝置、設備、存儲介質(zhì)及程序有效
| 申請?zhí)枺?/td> | 202110474693.8 | 申請日: | 2021-04-29 |
| 公開(公告)號: | CN113190154B | 公開(公告)日: | 2023-10-13 |
| 發(fā)明(設計)人: | 黃雪原;張錚 | 申請(專利權)人: | 北京百度網(wǎng)訊科技有限公司 |
| 主分類號: | G06F3/0484 | 分類號: | G06F3/0484;G06F16/35;G06F40/279 |
| 代理公司: | 北京同立鈞成知識產(chǎn)權代理有限公司 11205 | 代理人: | 張芳;劉芳 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 模型 訓練 詞條 分類 方法 裝置 設備 存儲 介質(zhì) 程序 | ||
本公開提供了模型訓練、詞條分類方法、裝置、設備、存儲介質(zhì)及程序,涉及人工智能中的機器學習和自然語言處理技術領域。具體實現(xiàn)方案為:獲取預設的多個對象類別,以及所述多個對象類別中不同對象類別之間的交集關系,具有交集關系的不同對象類別所指示的對象中存在重疊部分,根據(jù)所述多個對象類別中不同對象類別之間的交集關系,以及所述多個對象類別對應的訓練樣本,進行子模型訓練,得到分類模型;其中,所述分類模型包括多個所述子模型,具有交集關系的對象類別所對應的子模型不同。這樣,可以利用訓練后的分類模型對對象進行分類,從而提高對象類別的準確性。
技術領域
本公開涉及人工智能中的機器學習和自然語言處理技術領域,尤其涉及一種模型訓練、詞條分類方法、裝置、設備、存儲介質(zhì)及程序。
背景技術
詞條是構(gòu)成網(wǎng)絡百科全書的基本單元,是對各種概念、事物、現(xiàn)象及最新發(fā)現(xiàn)等概念的解釋。
在詞條的各類應用場景中,通常是根據(jù)詞條的類別對詞條進行處理,因此,詞條類別的準確性直接影響詞條質(zhì)量以及詞條應用的效果。通常,一個詞條的類別是由用戶在創(chuàng)建該詞條的過程中從多個預設類別中手動選擇的,受到用戶主觀因素的影響,使得詞條類別的準確性較低。
發(fā)明內(nèi)容
本公開提供了一種模型訓練、詞條分類方法、裝置、設備、存儲介質(zhì)及程序。
根據(jù)本公開的第一方面,提供了一種分類模型的訓練方法,包括:
獲取預設的多個對象類別,以及所述多個對象類別中不同對象類別之間的交集關系,具有交集關系的不同對象類別所指示的對象中存在重疊部分;
根據(jù)所述多個對象類別中不同對象類別之間的交集關系,以及所述多個對象類別對應的訓練樣本,進行子模型訓練,得到所述分類模型;其中,所述分類模型包括多個所述子模型,具有交集關系的對象類別所對應的子模型不同。
根據(jù)本公開的第二方面,提供了一種詞條分類方法,包括:
獲取待分類詞條的內(nèi)容;
將所述待分類詞條的內(nèi)容輸入已訓練好的分類模型,所述分類模型包括多個子模型;
根據(jù)所述多個子模型的輸出結(jié)果,確定所述詞條對應的至少一個目標類別;
其中,所述分類模型是采用如第一方面所述的方法訓練得到的。
根據(jù)本公開的第三方面,提供了一種分類模型的訓練裝置,包括:
獲取模塊,用于獲取預設的多個對象類別,以及所述多個對象類別中不同對象類別之間的交集關系,具有交集關系的不同對象類別所指示的對象中存在重疊部分;
訓練模塊,用于根據(jù)所述多個對象類別中不同對象類別之間的交集關系,以及所述多個對象類別對應的訓練樣本,進行子模型訓練,得到所述分類模型;其中,所述分類模型包括多個所述子模型,具有交集關系的對象類別所對應的子模型不同。
根據(jù)本公開的第四方面,提供了一種詞條分類裝置,包括:
獲取模塊,用于獲取待分類詞條的內(nèi)容;
處理模塊,用于將所述待分類詞條的內(nèi)容輸入已訓練好的分類模型,所述分類模型包括多個子模型;
確定模塊,用于根據(jù)所述多個子模型的輸出結(jié)果,確定所述詞條對應的至少一個目標類別;
其中,所述分類模型是采用如第一方面所述的方法訓練得到的。
根據(jù)本公開的第五方面,提供了一種電子設備,包括:
至少一個處理器;以及
與所述至少一個處理器通信連接的存儲器;其中,
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網(wǎng)訊科技有限公司,未經(jīng)北京百度網(wǎng)訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110474693.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字數(shù)據(jù)處理
G06F3-00 用于將所要處理的數(shù)據(jù)轉(zhuǎn)變成為計算機能夠處理的形式的輸入裝置;用于將數(shù)據(jù)從處理機傳送到輸出設備的輸出裝置,例如,接口裝置
G06F3-01 .用于用戶和計算機之間交互的輸入裝置或輸入和輸出組合裝置
G06F3-05 .在規(guī)定的時間間隔上,利用模擬量取樣的數(shù)字輸入
G06F3-06 .來自記錄載體的數(shù)字輸入,或者到記錄載體上去的數(shù)字輸出
G06F3-09 .到打字機上去的數(shù)字輸出
G06F3-12 .到打印裝置上去的數(shù)字輸出





