[發明專利]基于大數據的深度學習樣本標注方法在審
| 申請號: | 202011331925.6 | 申請日: | 2020-05-15 |
| 公開(公告)號: | CN112269817A | 公開(公告)日: | 2021-01-26 |
| 發明(設計)人: | 不公告發明人 | 申請(專利權)人: | 廣州知弘科技有限公司 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458;G06F16/901;G06F16/906;G06N3/04;G06N3/08 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 510000 廣東省廣州市黃埔區*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 數據 深度 學習 樣本 標注 方法 | ||
本發明提供了一種基于大數據的深度學習樣本標注方法,該方法包括:接收與樣本庫中的第一組樣本對象相關的用戶標注輸入;訓練包含權值向量的偏好預測模型,所述權值向量包含與樣本庫相關聯的多個特征中的每個特征的加權值,該樣本庫包括向用戶呈現的第一組樣本對象,利用所接收的用戶標注輸入來訓練每個特征的加權值;選擇要提供至用戶的第二組樣本對象,所述第二組樣本對象相對于樣本庫中其他未被標識的樣本對象,提供從用戶標注輸入獲取的更多的先驗知識;以及根據訓練后的偏好預測模型,推送預設數量的偏好對象以提供至用戶。本發明提出了一種基于大數據的深度學習樣本標注方法,基于用戶的固有交互操作來挖掘用戶興趣偏好信息,提高樣本標注效率和深度學習效果,從而便于更好地實現精準內容推薦。
技術領域
本發明涉及機器學習,特別涉及一種基于大數據的深度學習樣本標注方法。
背景技術
在信息過載的時代,基于個性的推薦顯得愈發重要。傳統技術基于對用戶顯式反饋數據的分析,例如在線教育平臺請求用戶對課程和教師等對象進行評分,而實際上顯式反饋數據量和應用場景相對有限,無論是評分量表和問卷,都需要占用用戶大量時間,導致體驗不佳。現實中,大量的用戶興趣信息往往隱藏在用戶的正常交互操作中。在進行用戶偏好的挖掘時,如果標簽信息不確定,則首先需要人為標注或者事先確定,進而通過完整的數據集訓練機器學習模型,再去預測用戶偏好的對象信息。而手工標注的方式消耗了大量的人力資源,并且存在人為的偏差,導致標注信息確定效率低、效果差;從而無法實現對用戶的精準推薦。而對于不平衡率較高的樣本,即存在少數類和多數類的被標注樣本,樣本的分類很容易向多數類偏移。
發明內容
為解決上述現有技術所存在的問題,本發明提出了一種基于大數據的深度學習樣本標注方法,包括:
接收與樣本庫中的第一組樣本對象相關的用戶標注輸入,所述用戶標注輸入表征相對于第一組樣本對象中其他樣本對象,用戶對所標注樣本對象的偏好;
訓練包含權值向量的偏好預測模型,所述權值向量包含與樣本庫相關聯的多個特征中的每個特征的加權值,該樣本庫包括向用戶呈現的第一組樣本對象,利用所接收的用戶標注輸入來訓練每個特征的加權值;
選擇要提供至用戶的第二組樣本對象,所述第二組樣本對象相對于樣本庫中其他未被標識的樣本對象,提供從用戶標注輸入獲取的更多的先驗知識;以及
根據訓練后的偏好預測模型,推送預設數量的偏好對象以提供至用戶。
優選地,所述選擇要提供至用戶的第二組樣本對象,進一步包括:
利用為樣本庫中樣本子集的每個樣本對象確定的偏好分值來確定樣本對象的先驗知識獲取度量,所述偏好分值是利用訓練的偏好預測模型與樣本對象的多個特征共同確定。
優選地,所述確定樣本對象的先驗知識獲取度量進一步包括:
為樣本庫中樣本子集的每個樣本對象,確定樣本對象的特異性度量,所述特異性度量包含有關用戶對樣本對象的偏好的可信度;
確定樣本對象的典型性度量,上述典型性度量包含樣本對象與所述樣本庫中其他樣本的特征相似度;以及
利用所述樣本對象的已確定的特異性度量和典型性度量,確定對象的先驗知識獲取度量。
優選地,所述確定對象的特異性度量進一步包括:
利用用戶的偏好預測模型來確定對象的偏好分值,所述偏好預測模型利用與所述第一組對象有關的用戶標注輸入所訓練;以及
利用對象的偏好分值來確定對象的特異性度量。
優選地,所述利用樣本對象的偏好分值來確定特異性度量,進一步包括:
根據以下方法確定對象fs的特異性度量SPL:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州知弘科技有限公司,未經廣州知弘科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011331925.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種用于食品的相互力的抵消運輸箱
- 下一篇:汽車固定玻璃支架結構
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





