[發明專利]文檔標題生成方法、裝置、設備及存儲介質在審
| 申請號: | 202210072397.X | 申請日: | 2022-01-21 |
| 公開(公告)號: | CN114399775A | 公開(公告)日: | 2022-04-26 |
| 發明(設計)人: | 唐小初;張祎頔;舒暢;陳又新 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06V30/40 | 分類號: | G06V30/40;G06K9/62;G06N3/04;G06N3/08;G06V30/148;G06V10/74;G06V10/774 |
| 代理公司: | 深圳市沃德知識產權代理事務所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文檔 標題 生成 方法 裝置 設備 存儲 介質 | ||
1.一種文檔標題生成方法,其特征在于,所述方法包括:
獲取原始文檔信息,所述原始文檔信息中包含原始文本信息、原始圖像信息和原始位置信息;
對所述原始文檔信息進行區塊劃分,得到多個文本子信息、多個圖像子信息和多個位置子信息;
將多個所述文本子信息輸入至預訓練好的文本編碼模型中進行文本編碼,得到文本特征向量;
利用預設的特征提取模型提取多個所述圖像子信息中的圖像特征;
對多個所述位置子信息進行位置編碼,得到多維位置向量;
對所述文本特征向量、所述圖像特征和所述多維位置向量進行加權相加,得到最終輸入向量,并將所述最終輸入向量輸入至transformer encoder模型中進行融合編碼,得到最終輸出特征;
利用預設的解碼器模塊對所述最終輸出特征進行特征解碼,得到包含標題的文檔區塊。
2.如權利要求1所述的文檔標題生成方法,其特征在于,所述利用預設的解碼器模塊對所述最終輸出特征進行特征解碼,得到包含標題的文檔區塊,包括:
利用所述解碼器模塊中的第一解碼器對所述最終輸出特征進行第一特征解碼,得到包含標注類別的所述原始文檔信息;
選取所述包含標注類別的所述原始文檔信息中符合預設類別的文檔區塊;
利用所述解碼器模塊中的第二解碼器對所述符合預設類別的文檔區塊進行標題分類,得到包含標題的文檔區塊。
3.如權利要求1所述的文檔標題生成方法,其特征在于,所述對多個所述位置子信息進行位置編碼,得到多維位置向量,包括:
獲取多個所述位置子信息的相關數據,并將所述相關數據映射到預設維度;
通過embedding層對預設的維度的相關數據進行編碼,得到多維位置向量。
4.如權利要求1所述的文檔標題生成方法,其特征在于,所述將多個所述文本子信息輸入至預訓練好的文本編碼模型中進行文本編碼之前,所述方法還包括:
獲取訓練數據集,將所述訓練數據集中的任意一個訓練數據輸入至預設的文本編碼模型中進行不同的過擬合,得到第一句向量和第二句向量;
計算所述第一句向量和所述第二句向量之間的向量相似度;
根據所述向量相似度和預設的目標函數公式計算所述訓練數據對應的目標值;
根據所述目標值對所述文本編碼模型進行參數調整,輸出訓練好的文本編碼模型。
5.如權利要求4所述的文檔標題生成方法,其特征在于,所述預設的目標函數公式為:
其中,l為目標值,τ為溫度系數,hj為負樣本,sim(h1,h2)為所述第一句向量和所述第二句向量之間的向量相似度。
6.如權利要求4所述的文檔標題生成方法,其特征在于,所述計算所述第一句向量和所述第二句向量之間的向量相似度,包括:
利用如下公式計算所述第一句向量和所述第二句向量之間的向量相似度:
其中,sim(h1,h2)為所述第一句向量和所述第二句向量之間的向量相似度,h1為所述第一句向量,h2為所述第二句向量,h1T為所述第一句向量的轉置向量,||h1||為所述第一句向量的模,||h2||為所述第二句向量的模。
7.如權利要求1至6中任一項所述的文檔標題生成方法,其特征在于,所述利用預設的特征提取模型提取多個所述圖像子信息中的圖像特征,包括:
將所述圖像子信息輸入至所述特征提取模型中的卷積模塊中,得到卷積數據;
利用所述特征提取模型中的特征模塊對所述卷積數據進行特征處理,得到圖像特征。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210072397.X/1.html,轉載請聲明來源鉆瓜專利網。





