[發明專利]特征量化模型訓練、特征量化、數據查詢方法及系統在審
| 申請號: | 202010181479.9 | 申請日: | 2020-03-16 |
| 公開(公告)號: | CN113408552A | 公開(公告)日: | 2021-09-17 |
| 發明(設計)人: | 方奕庚;穆亞東;唐小軍 | 申請(專利權)人: | 京東方科技集團股份有限公司;北京大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06F16/903 |
| 代理公司: | 北京銀龍知識產權代理有限公司 11243 | 代理人: | 許靜;胡影 |
| 地址: | 100015 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 特征 量化 模型 訓練 數據 查詢 方法 系統 | ||
1.一種特征量化模型訓練方法,其中,包括:
獲取多個源數據域;
獲取每一所述源數據域的特征信息和標注信息;
根據所有所述源數據域的特征信息和標注信息,對特征量化模型進行訓練,得到公共特征量化模型,其中,訓練過程中,從所述多個源數據域的特征信息中分解出公共特征信息和域專有的特征信息,所述公共特征信息為所述多個源數據域共有的特征信息。
2.如權利要求1所述的特征量化模型訓練方法,其中,所述根據所有所述源數據域的特征信息和標注信息,對特征量化模型進行訓練,得到公共特征量化模型包括:
根據所有所述源數據域的特征信息和標注信息,對特征量化模型進行訓練,得到公共特征量化模型和每一所述源數據域的域專有的特征量化模型。
3.如權利要求2所述的特征量化模型訓練方法,其中,采用深度神經網絡算法對特征量化模型進行訓練。
4.如權利要求1或2所述的特征量化模型訓練方法,其中,所述對特征量化模型進行訓練包括:
調整所述特征量化模型,使得對于所有所述源數據域,Ex(L(F0(X),Y))取最小值;
其中,X為表示所有所述源數據域的特征信息,Y為所有所述源數據域的標注信息,F0表示公共特征量化模型,F0(X)表示特征信息X經過F0處理后得到的特征量化碼,L(F0(X),Y)表示所述特征量化碼與標注信息Y之間的損失函數,Ex(L(F0(X),Y))表示L函數針對特征信息X的數學期望。
5.如權利要求4所述的特征量化模型訓練方法,其中,所述對特征量化模型進行訓練還包括:
調整所述特征量化模型,使得對于任意所述源數據域k,Ex(L(φ(F0(x),Fk(x)),y))取最小值,以及,對于任意所述源數據域k,Ex(L(φ(F0(x),Fk(x)),y))Ex(L(φ(F0(x),Fp(x)),y)),其中,p不等于k;
其中,x表示所述源數據域k的特征信息,y為所述源數據域k的標注信息,F0表示公共特征量化模型,F0(x)表示特征信息x經過F0處理后得到的特征量化碼,Fk表示所述源數據域k的域專有的特征量化模型,Fk(x)表示特征信息x經過Fk處理后得到的特征量化碼,Fp表示所述源數據域p的域專有的特征量化模型,Fp(x)表示特征信息x經過Fp處理后得到的特征量化碼,φ(F0(x),Fk(x))表示對F0(x)和Fk(x)進行融合處理,φ(F0(x),Fp(x))表示對F0(x)和Fp(x)進行融合處理,L(φ(F0(x),Fk(x)),y)和L(φ(F0(x),Fp(x)),y)表示經過融合處理后的特征量化碼與標注信息y之間的損失函數,Ex()表示數學期望函數,k=1,2,…,K,p=1,2,…,K,K為所述源數據域的個數。
6.如權利要求5所述的特征量化模型訓練方法,其中,采用相加或者線性拼接的方法進行所述融合處理。
7.一種特征量化方法,其中,包括:
采用公共特征量化模型對目標數據集進行特征量化,得到目標數據集的特征量化碼,所述公共特征量化模型采用如權利要求1-6任一項所述的特征量化模型訓練方法訓練得到。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于京東方科技集團股份有限公司;北京大學,未經京東方科技集團股份有限公司;北京大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010181479.9/1.html,轉載請聲明來源鉆瓜專利網。





