[發(fā)明專利]一種用于建模ad-hoc檢索任務(wù)中多樣相關(guān)特征的信息檢索模型在審
| 申請?zhí)枺?/td> | 201910898272.0 | 申請日: | 2019-09-23 |
| 公開(公告)號: | CN111444414A | 公開(公告)日: | 2020-07-24 |
| 發(fā)明(設(shè)計)人: | 胡澤婷;張鵬;蔣永余 | 申請(專利權(quán))人: | 天津大學(xué) |
| 主分類號: | G06F16/953 | 分類號: | G06F16/953;G06F16/33 |
| 代理公司: | 天津市北洋有限責(zé)任專利代理事務(wù)所 12201 | 代理人: | 韓帥 |
| 地址: | 300072*** | 國省代碼: | 天津;12 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 用于 建模 ad hoc 檢索 任務(wù) 多樣 相關(guān) 特征 信息 模型 | ||
1.一種用于建模ad-hoc檢索任務(wù)中多樣相關(guān)特征的信息檢索模型,其特征在于,包括如下步驟:
(1)根據(jù)topic構(gòu)建語料集,語料集的總樣本是N個topic,其中每個topic包含一個查詢和一系列文檔;
(2)從(1)的語料集中,隨機選取80%*N個topic作為訓(xùn)練集和剩余的20%*N個topic作為測試集,并分別對訓(xùn)練集和測試集進行預(yù)處理;
(3)對預(yù)處理之后的查詢和文檔構(gòu)建Match-Transformer模型;
(4)將訓(xùn)練集查詢和文檔的表示輸入到Match-Transformer模型,并利用多層感知機計算文檔的得分;
(5)通過Learning-to-Rank算法對訓(xùn)練后的Match-Transformer模型進行參數(shù)更新;
(6)將測試集數(shù)據(jù)輸入到訓(xùn)練后的Match-Transformer模型中計算出每個topic的最后返回文檔排名得分;
(7)將Match-Transformer模型在測試集上的評價結(jié)果輸出。
2.根據(jù)權(quán)利要求1所述的一種用于建模ad-hoc檢索任務(wù)中多樣相關(guān)特征的信息檢索模型,其特征在于,所述步驟(3)中Match-Transformer模型構(gòu)建方法,包括如下步驟:
3.1運用glove工具得到每個文本中單詞的300維詞向量,模型初始化階段用均勻分布初始化該參數(shù)矩陣,并在模型訓(xùn)練過程中更新優(yōu)化;且對文本中每個查詢和文檔中單詞的詞向量,分別對應(yīng)WiQ和WjD;其中,查詢有n個單詞,文檔有m個單詞,即i=1,…,n;j=1,…,m。
3.2判斷查詢中的詞向量WiQ是否在文檔TD中出現(xiàn)構(gòu)建如下Overlap Embedding函數(shù);
3.3結(jié)合前面兩步操作,即可得到查詢和文檔的全局信息(詞向量)和局部信息(傳統(tǒng)的信息檢索特征),即:
其中,表示查詢中第i個單詞的tf值以及表示文檔中第j個詞的tf-idf值;
3.4鑒于上面的步驟并沒有考慮查詢詞之間和文檔詞之間的依賴信息,將查詢和文檔的信息分別用一個密度算子來表示,即:
3.根據(jù)權(quán)利要求2所述的一種用于建模ad-hoc檢索任務(wù)中多樣相關(guān)特征的信息檢索模型,其特征在于,所述步驟3.4中為了進一步得到查詢和文檔之間的匹配特征信息,即:
其中,
headi=σ(PWiP,KWiK,VWiV)
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于天津大學(xué),未經(jīng)天津大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910898272.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 用于短距離AD-HOC數(shù)據(jù)通信的無線用戶站
- Ad Hoc網(wǎng)絡(luò)拓撲穩(wěn)定期檢測方法
- Ad Hoc網(wǎng)絡(luò)與IPv6網(wǎng)絡(luò)全IP通信互聯(lián)系統(tǒng)
- 一種無線Ad Hoc網(wǎng)絡(luò)可靠性度量方法
- 使異構(gòu)無線AD-HOC網(wǎng)絡(luò)中服務(wù)提供方效用最大化
- 一種3G與Ad hoc異構(gòu)網(wǎng)絡(luò)的切換方法
- 一種船舶移動ad hoc網(wǎng)絡(luò)系統(tǒng)、組網(wǎng)方法及工作方法
- 一種融合刪除法的Ad Hoc網(wǎng)絡(luò)關(guān)鍵節(jié)點識別方法
- 一種動態(tài)AdHoc網(wǎng)絡(luò)關(guān)鍵節(jié)點識別方法
- 一種實時檢測Ad hoc網(wǎng)絡(luò)關(guān)鍵節(jié)點的方法及裝置





