[發明專利]一種表示學習模型的評估方法、裝置、設備及介質在審
| 申請號: | 201910549544.6 | 申請日: | 2019-06-24 |
| 公開(公告)號: | CN110263939A | 公開(公告)日: | 2019-09-20 |
| 發明(設計)人: | 周晉;李超;王翔 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06N20/00 | 分類號: | G06N20/00 |
| 代理公司: | 深圳市深佳知識產權代理事務所(普通合伙) 44285 | 代理人: | 王仲凱 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 學習 樣本 量化指標 向量 性能評價指標 訓練過程 迭代過程 機器學習 模型生成 樣本表示 樣本子集 無監督 衡量 評估 申請 本子 | ||
本申請公開了一種表示學習模型的評估方法,包括:針對基于無監督方式進行訓練的表示學習模型生成性能評價指標,其包括第一指標和第二指標中的至少一個,其中,第一指標是基于表示學習模型在訓練過程中學習到的第一樣本子集中各樣本的表示向量,生成的用于衡量同類樣本相近且不同類樣本相疏遠的量化指標,第二指標是基于表示學習模型在訓練過程中學習到的第二樣本子集中各樣本的表示向量對應的相似向量,生成的用于衡量樣本表示穩定性的量化指標,根據所述性能評價指標,確定所述表示學習模型的訓練情況。通過上述量化指標,使得不再依賴于后續的機器學習任務,整個表示學習的訓練迭代過程大大加快。本申請還公開了對應的裝置、設備及介質。
技術領域
本申請涉及計算機技術領域,尤其涉及一種表示學習模型的評估方法、裝置、設備及計算機存儲介質。
背景技術
表示學習是指通過學習數據的表示,將原始數據轉換成能夠被機器學習來有效開發的形式,使得其后續構建分類器或者其他預測任務時更容易提取有用信息的任務。通俗來講,就是將數據轉換成向量表示,同時使得向量包含盡可能多的、對后續任務有用的數據信息。近年來,表示學習在語音、圖像等領域廣受關注。
無監督表示學習是指在無標簽訓練數據上訓練表示學習模型。由于沒有已知的標簽,無法將無監督學習的結果與實際標簽進行比較,所以很難評估無監督學習的模型。
通常,對基于無監督方式訓練的表示學習模型的評估,是依賴于后續機器學習任務的評估結果,這就導致無監督表示學習模型的訓練、優化迭代的周期延長,增加了模型訓練的時間成本,拖慢模型的迭代速度,造成實際應用損失。
發明內容
本申請提供了一種表示學習模型的評估方法,其提出了兩種評估訓練質量的量化指標,以衡量無監督表示學習模型的訓練狀況,從而及時發現訓練過程中的異常情況,避免訓練周期延長、訓練速度放緩以及訓練時間成本增加,進而避免對實際應用造成損傷。本申請還提供了對應的裝置、設備、介質及計算機程序產品。
本申請第一方面提供了一種表示學習模型的評估方法,所述方法包括:
針對基于無監督方式進行訓練的表示學習模型,生成所述表示學習模型的性能評價指標,所述性能評價指標包括第一指標和第二指標中的至少一個;
其中,所述第一指標是基于所述表示學習模型在訓練過程中學習到的第一樣本子集中各樣本的表示向量,生成的用于衡量同類樣本相近且不同類樣本相疏遠的量化指標;所述第一樣本子集是對所述表示學習模型的訓練樣本集中的第一子集進行標簽標注生成的,所述第一子集包括不同類別的樣本;
所述第二指標是基于所述表示學習模型在訓練過程中學習到的第二樣本子集中各樣本的表示向量對應的相似向量,生成的用于衡量樣本表示穩定性的量化指標;所述第二樣本子集是所述訓練樣本集中的第二子集;
根據所述性能評價指標,確定所述表示學習模型的訓練情況。
本申請第二方面提供一種表示學習模型的評估裝置,所述裝置包括:
指標生成模塊,用于針對基于無監督方式進行訓練的表示學習模型,生成所述表示學習模型的性能評價指標,所述性能評價指標包括第一指標和第二指標中的至少一個;
其中,所述第一指標是基于所述表示學習模型在訓練過程中學習到的第一樣本子集中各樣本的表示向量,生成的用于衡量同類樣本相近且不同類樣本相疏遠的量化指標;所述第一樣本子集是對所述表示學習模型的訓練樣本集中的第一子集進行標簽標注生成的,所述第一子集包括不同類別的樣本;
所述第二指標是基于所述表示學習模型在訓練過程中學習到的第二樣本子集中各樣本的表示向量對應的相似向量,生成的用于衡量樣本表示穩定性的量化指標;所述第二樣本子集是所述訓練樣本集中的第二子集;
評估模塊,用于根據所述性能評價指標,確定所述表示學習模型的訓練情況。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910549544.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用于生成信息的方法和裝置
- 下一篇:一種IT運維管理平臺





