[發明專利]網絡模型訓練方法、樣本關系類別獲取方法、電子設備在審
| 申請號: | 202110008841.7 | 申請日: | 2021-01-05 |
| 公開(公告)號: | CN114722887A | 公開(公告)日: | 2022-07-08 |
| 發明(設計)人: | 張奇;孫晉權;王宇 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京博浩百睿知識產權代理有限責任公司 11134 | 代理人: | 趙昀彬 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 網絡 模型 訓練 方法 樣本 關系 類別 獲取 電子設備 | ||
本發明公開了一種網絡模型訓練方法、樣本關系類別獲取方法、電子設備。其中,該方法包括:獲取監督數據集,其中,上述監督數據集包括:多個待訓練樣本;按照上述多個待訓練樣本的樣本關系類別,對上述監督數據集進行聚類處理,得到多個簇;利用上述多個簇對初始網絡模型進行迭代訓練,得到目標網絡模型,其中,上述初始網絡模型和上述目標網絡模型用于抽取監督關系。本發明解決了現有技術中的關系抽取網絡模型對復雜樣本的學習能力較低,存在抑制多樣性樣本學習的技術問題。
技術領域
本發明涉及網絡模型訓練領域,具體而言,涉及一種網絡模型訓練方法、樣本關系類別獲取方法、電子設備。
背景技術
在相關技術中,關系抽取意義重大,該領域中海量資料文獻中包含著大量知識,如果能夠將這些知識結構化,不僅利于計算機存儲,而且可以為下游諸多應用提供便利,例如,檢索,問答等應用。
此前,在監督關系抽取這個研究領域的一些研究成果,大部分成果都集中在研究如何讓模型在對監督的數據集的學習過程中盡可能少地受到噪音數據的干擾,不管是通過多示例學習選出一個包中后驗概率最高的樣本代表整個數據集并作為整個包的特征,或是通過注意力機制對數據集內所有樣本進行加權,模型總是通過對一個數據集內少數有代表性學習樣本的學習來抑制噪音數據的影響。
然而,關系抽取依賴大規模的標注數據,監督雖然能利用已有的知識庫自動地生成帶標簽的實體關系抽取訓練數據,但是其生成的數據存在很多的問題,包括之前的研究中廣泛涉及的數據集內樣本噪音問題以及在本申請文件中首次提出的多樣性抑制問題。
針對上述的問題,目前尚未提出有效的解決方案。
發明內容
本發明實施例提供了一種網絡模型訓練方法、樣本關系類別獲取方法、電子設備,以至少解決現有技術中的關系抽取網絡模型對復雜樣本的學習能力較低,存在抑制多樣性樣本學習的技術問題。
根據本發明實施例的一個方面,提供了一種網絡模型訓練方法,包括:獲取監督數據集,其中,上述監督數據集包括:多個待訓練樣本;按照上述多個待訓練樣本的樣本關系類別,對上述監督數據集進行聚類處理,得到多個簇;利用上述多個簇對初始網絡模型進行迭代訓練,得到目標網絡模型,其中,上述初始網絡模型和上述目標網絡模型用于抽取監督關系。
根據本發明實施例的另一方面,還提供了一種樣本關系類別獲取方法,包括:獲取待預測樣本;利用上述待預測樣本構造樣本特征向量;將上述樣本特征向量輸入至目標網絡模型,輸出上述待預測樣本對應的樣本關系類別,其中,上述目標網絡模型利用監督數據集對初始網絡模型進行迭代訓練來獲得,上述監督數據集包括:多個待訓練樣本,上述監督數據集用于按照上述多個待訓練樣本的樣本關系類別進行聚類處理以得到多個簇,上述多個簇用于對上述初始網絡模型進行迭代訓練以得到上述目標網絡模型,上述初始網絡模型和上述目標網絡模型用于抽取監督關系。
根據本發明實施例的另一方面,還提供了一種樣本關系類別獲取方法,包括:接收當前輸入的待預測樣本;將上述待預測樣本發送至服務端;接收來自于上述服務端的上述待預測樣本對應的樣本關系類別,其中,上述樣本關系類別由上述服務端利用目標網絡模型來獲得,上述目標網絡模型利用監督數據集對初始網絡模型進行迭代訓練來獲得,上述監督數據集包括:多個待訓練樣本,上述監督數據集用于按照上述多個待訓練樣本的樣本關系類別進行聚類處理以得到多個簇,上述多個簇用于對上述初始網絡模型進行迭代訓練以得到上述目標網絡模型,上述初始網絡模型和上述目標網絡模型用于抽取監督關系;在客戶端本地顯示上述樣本關系類別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110008841.7/2.html,轉載請聲明來源鉆瓜專利網。





