[發(fā)明專利]基于條件生成模型的近似查詢處理算法有效
| 申請?zhí)枺?/td> | 202110487805.3 | 申請日: | 2021-04-30 |
| 公開(公告)號(hào): | CN113177078B | 公開(公告)日: | 2022-06-17 |
| 發(fā)明(設(shè)計(jì))人: | 白文超;韓希先;何京璇 | 申請(專利權(quán))人: | 哈爾濱工業(yè)大學(xué)(威海) |
| 主分類號(hào): | G06F16/2458 | 分類號(hào): | G06F16/2458;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 青島華慧澤專利代理事務(wù)所(普通合伙) 37247 | 代理人: | 馬千會(huì) |
| 地址: | 264209*** | 國省代碼: | 山東;37 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 條件 生成 模型 近似 查詢 處理 算法 | ||
1.基于條件生成模型的近似查詢處理算法,包括:
采用聚集預(yù)計(jì)算獲得用戶查詢的預(yù)聚集值;
對用戶查詢進(jìn)行處理,獲得估計(jì)用戶查詢與預(yù)聚集范圍之間差異的新查詢newQ及選擇的預(yù)聚集值;其特征在于:
構(gòu)建基于Wasserstein的條件變分生成對抗網(wǎng)絡(luò)模型,利用訓(xùn)練完成的模型為新查詢newQ生成數(shù)據(jù)樣本;
對生成的數(shù)據(jù)樣本進(jìn)行過濾,將過濾后的數(shù)據(jù)樣本與選擇的預(yù)聚集值相結(jié)合,計(jì)算得到最終的查詢估計(jì)值;
所述的模型由編碼網(wǎng)絡(luò)、生成網(wǎng)絡(luò)以及鑒別網(wǎng)絡(luò)組成;
所述模型的訓(xùn)練過程包括數(shù)據(jù)預(yù)處理階段,對原始數(shù)據(jù)進(jìn)行聚類預(yù)處理,獲得聚類后的真實(shí)數(shù)據(jù)X以及各類的條件特征Y;
所述模型的訓(xùn)練過程還包括迭代訓(xùn)練階段,將所述數(shù)據(jù)預(yù)處理階段獲得的真實(shí)數(shù)據(jù)X與對應(yīng)的條件特征Y相融合作為模型的輸入,使用編碼網(wǎng)絡(luò)得到潛層空間中數(shù)據(jù)分布的均值μ與方差δ2;并以μ和δ2作為參數(shù),通過Random()隨機(jī)函數(shù)產(chǎn)生潛層空間中的噪音數(shù)據(jù)Z={z1,...,zn};生成網(wǎng)絡(luò)從潛層空間中隨機(jī)地抽取一組噪音數(shù)據(jù),并通過深層網(wǎng)絡(luò)模型生成滿足條件特征Y的虛假樣本X_Fake;使用鑒別網(wǎng)絡(luò)對X_Fake進(jìn)行判斷,得到X_Fake為真的概率值;
所述迭代訓(xùn)練階段還包括采用KL散度損失函數(shù)來計(jì)算編碼網(wǎng)絡(luò)的誤差損失,計(jì)算公式為:
其中,KL_loss表示編碼網(wǎng)絡(luò)構(gòu)造的潛層空間中,數(shù)據(jù)的實(shí)際分布Q(Z|X)與期望分布P(Z|X)之間的差異;μ和σ2分別表示編碼網(wǎng)絡(luò)生成的均值與方差;k表示模型在數(shù)據(jù)預(yù)處理階段聚類所劃分的類別的個(gè)數(shù);j=1,2,……,k,表示第j個(gè)類別;
所述迭代訓(xùn)練階段還包括采用Wasserstein距離作為損失函數(shù)計(jì)算生成網(wǎng)絡(luò)、鑒別網(wǎng)絡(luò)的誤差損失:
G_loss=-E(D(X_Fake))
D_loss=E(D(X_Fake))-E(D(X))
其中,G、D分別表示生成網(wǎng)絡(luò)和鑒別網(wǎng)絡(luò);D(X_Fake)表示虛假數(shù)據(jù)X_Fake為真的概率。
2.根據(jù)權(quán)利要求1所述的基于條件生成模型的近似查詢處理算法,其特征在于:所述迭代訓(xùn)練階段還包括采用交叉熵?fù)p失函數(shù)來計(jì)算生成網(wǎng)絡(luò)的誤差損失:
其中,RE_loss表示生成網(wǎng)絡(luò)生成的虛假數(shù)據(jù)X_Fake與真實(shí)數(shù)據(jù)X之間的差異。
3.根據(jù)權(quán)利要求1所述的基于條件生成模型的近似查詢處理算法,其特征在于:在所述迭代訓(xùn)練階段,使用RMSPropOptimizer作為模型優(yōu)化器,優(yōu)化各網(wǎng)絡(luò)的參數(shù)。
4.根據(jù)權(quán)利要求1所述的基于條件生成模型的近似查詢處理算法,其特征在于:采用所述預(yù)處理階段獲得的原始數(shù)據(jù)的各個(gè)類別作為預(yù)聚集計(jì)算的范圍。
5.根據(jù)權(quán)利要求1-4任一項(xiàng)所述的基于條件生成模型的近似查詢處理算法,其特征在于:所述數(shù)據(jù)樣本的過濾采用表決算法;所述的表決算法包括樣本過濾器和數(shù)據(jù)過濾器;所述樣本過濾器用于對模型生成的單一樣本進(jìn)行分類預(yù)測;所述數(shù)據(jù)過濾器用于對樣本內(nèi)部數(shù)據(jù)進(jìn)行快速預(yù)測。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于哈爾濱工業(yè)大學(xué)(威海),未經(jīng)哈爾濱工業(yè)大學(xué)(威海)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110487805.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 限制條件解決方法、限制條件解決裝置、以及限制條件解決系統(tǒng)
- 制造條件設(shè)定系統(tǒng)及制造條件設(shè)定方法
- 成形條件確定方法及成形條件確定系統(tǒng)
- 成形條件設(shè)定裝置、成形條件設(shè)定方法及成形條件設(shè)定畫面
- 攝影條件設(shè)定設(shè)備、攝影條件設(shè)定方法和攝影條件設(shè)定程序
- 生理?xiàng)l件監(jiān)視系統(tǒng)、生理?xiàng)l件傳感器和生理?xiàng)l件儀表
- 成形條件設(shè)定裝置、成形條件設(shè)定方法及成形條件設(shè)定畫面
- 條件訪問設(shè)備
- 用于條件切換的裝置、方法、介質(zhì)和系統(tǒng)
- 基于條件分布的條件生成對抗網(wǎng)絡(luò)





