[發(fā)明專利]一種文本檢索的新方法在審
| 申請?zhí)枺?/td> | 202110130895.0 | 申請日: | 2021-01-30 |
| 公開(公告)號: | CN112732944A | 公開(公告)日: | 2021-04-30 |
| 發(fā)明(設(shè)計)人: | 盧奕南;趙延 | 申請(專利權(quán))人: | 吉林大學(xué) |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F40/242;G06N3/08 |
| 代理公司: | 長春市恒譽專利代理事務(wù)所(普通合伙) 22212 | 代理人: | 鞠傳龍 |
| 地址: | 130012 吉*** | 國省代碼: | 吉林;22 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 文本 檢索 新方法 | ||
1.一種文本檢索的新方法,其特征在于:其方法包括如下步驟:
第一部分、使用知識圖譜中構(gòu)造多關(guān)系下的實體表示詞典集,從多個角度描述實體語義,具體步驟如下:
步驟1、根據(jù)任務(wù)需要構(gòu)造一個知識圖譜,并由三元組進行表示,即包含主語、謂詞和賓語的描述;
步驟2、采用基于網(wǎng)絡(luò)表示學(xué)習(xí)中的DeepWalk的方法進行多關(guān)系的知識圖嵌入,得到各個關(guān)系下的實體表示詞典集;
第二部分、利用查詢和文檔集訓(xùn)練深度學(xué)習(xí)網(wǎng)絡(luò)得到模型,具體步驟如下:
步驟1、構(gòu)建訓(xùn)練集數(shù)據(jù),同時將各檢索問題和文檔集進行各關(guān)系下的實體表示;
步驟2、網(wǎng)絡(luò)輸入多關(guān)系下的每對檢索和文檔的實體表示,構(gòu)建相應(yīng)的多個相似度矩陣;
步驟3、對每個矩陣進行基于高斯核的特征提取,并引入多頭自注意力機制,提取各個關(guān)系下的特征;
步驟4、構(gòu)建全連接層,求得各個特征的排序分?jǐn)?shù),計算出它們的平均值;
步驟5、利用Pairwise方法進行深度學(xué)習(xí)的訓(xùn)練;
第三部分、給定一個檢索問題和測試文檔集中利用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型進行檢索,具體步驟如下:
步驟1、將檢索語句和測試文檔集進行多個關(guān)系的實體表示;
步驟2、對每對檢索語句和文檔表示構(gòu)建特征,利用訓(xùn)練得到的神經(jīng)網(wǎng)絡(luò)模型得到各個測試檢索文檔的排序分?jǐn)?shù);
步驟3、根據(jù)排序分?jǐn)?shù)對文檔進行排序。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于吉林大學(xué),未經(jīng)吉林大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110130895.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





