[發(fā)明專利]一種基于文本圖片檢索的相似文本檢測方法有效
| 申請?zhí)枺?/td> | 201710598424.6 | 申請日: | 2017-07-21 |
| 公開(公告)號: | CN107330127B | 公開(公告)日: | 2020-06-05 |
| 發(fā)明(設(shè)計)人: | 譚貌;原思平;金繼成;蘇永新 | 申請(專利權(quán))人: | 湘潭大學(xué) |
| 主分類號: | G06F16/13 | 分類號: | G06F16/13;G06F16/583;G06F16/53;G06N3/04;G06N3/08 |
| 代理公司: | 湘潭市匯智專利事務(wù)所(普通合伙) 43108 | 代理人: | 顏昌偉 |
| 地址: | 411105 湖南*** | 國省代碼: | 湖南;43 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 文本 圖片 檢索 相似 檢測 方法 | ||
1.一種基于文本圖片檢索的相似文本檢測方法,包括以下步驟:
步驟一:建立文檔庫;收集文本類型文檔建立文檔庫,為文檔庫中不同文檔建立唯一編號索引;
步驟二:建立文本圖片庫;將文檔庫中文檔按段落分割并轉(zhuǎn)換為圖片,建立文本圖片庫,同時根據(jù)分割前圖片所屬文檔的唯一編號生成“圖片名稱-文檔編號”索引,然后對文本圖片庫中每張文本圖片進(jìn)行等比例縮放、灰度轉(zhuǎn)換預(yù)處理,轉(zhuǎn)換為文本行高一致的灰度文本圖片;
步驟三:文本圖片庫中圖片的特征提取和降維;基于多層卷積神經(jīng)網(wǎng)絡(luò)提取文本圖片庫中每張圖片的特征向量,組成文本圖片庫對應(yīng)的特征矩陣,然后采用PCA方法對提取出的特征矩陣進(jìn)行壓縮降維;
步驟四:將檢索文檔分割為檢索圖片集;輸入檢索文檔,將檢索文檔按段落分割并轉(zhuǎn)換為圖片,建立檢索圖片集,然后對檢索圖片集中每張文本圖片進(jìn)行等比例縮放、灰度轉(zhuǎn)換預(yù)處理;
步驟五:檢索圖片集中圖片的特征提取和降維;用多層卷積神經(jīng)網(wǎng)絡(luò)模型提取檢索圖片集中每張圖片的特征向量,構(gòu)建檢索圖片集對應(yīng)的特征矩陣,并采用PCA方法壓縮到與文本圖片庫特征矩陣相同的特征點(diǎn)維度;
步驟六:檢索圖片集的余弦相似性度量;對檢索圖片集中每張文本圖片,計算其與文本圖片庫中所有文本圖片之間的余弦相似度,并對得到的余弦相似度進(jìn)行降序排列;
步驟七:檢索結(jié)果的全文相似度過濾;根據(jù)檢索圖片集中每張文本圖片與文本圖片庫中所有文本圖片之間的余弦相似度,求得檢索文檔與文檔庫文檔之間的相似度均值,根據(jù)相似度均值更新余弦相似度,并按余弦相似度降序重新排序;
步驟八:檢索結(jié)果輸出;針對檢索圖片集中每張圖片,根據(jù)其余弦相似度選取文本圖片庫中圖片作為輸出;針對檢索文檔,根據(jù)相似度均值選取文檔庫中文檔作為輸出。
2.根據(jù)權(quán)利要求1所述的基于文本圖片檢索的相似文本檢測方法,其特征在于,所述步驟三具體方法為:令多層卷積神經(jīng)網(wǎng)絡(luò)集合CNNS=(CNN1,CNN2,…CNNnc,),其中nc是CNNS中多層卷積神經(jīng)網(wǎng)絡(luò)的數(shù)量,CNNj1表示CNNS中第j1個多層卷積神經(jīng)網(wǎng)絡(luò),j1=1,2,...,nc;對CNNS中各個網(wǎng)絡(luò),逐一使用大規(guī)模文本圖片數(shù)據(jù)集以隨機(jī)梯度下降算法對CNNj1進(jìn)行預(yù)訓(xùn)練,再以預(yù)處理后的文本圖片庫對CNNj1進(jìn)行精調(diào),基于CNNj1提取文本圖片庫中每張圖片的特征向量,組成CNNj1對應(yīng)的文本圖片庫特征矩陣,采用PCA方法對特征矩陣進(jìn)行壓縮降維;最后計算CNNS中各個網(wǎng)絡(luò)的平均檢索精度,基于求得的平均檢索精度融合各個網(wǎng)絡(luò)對應(yīng)的特征矩陣。
3.根據(jù)權(quán)利要求2所述的基于文本圖片檢索的相似文本檢測方法,其特征在于,所述步驟三中,用CNNj1提取文本圖片庫中每張圖片的特征向量,組成文本圖片庫對應(yīng)的特征矩陣的具體步驟為:
3-1-1)初始化n×x大小的文本圖片庫特征矩陣W,W為零矩陣,n是文本圖片庫中圖片總數(shù),x是CNNj1網(wǎng)絡(luò)模型倒數(shù)第二層全連接層的神經(jīng)元個數(shù),設(shè)置圖片截取的窗口大小為side×side,設(shè)置循環(huán)變量i1=1;
3-1-2)讀取文本圖片庫中第i1張圖片的像素數(shù)據(jù)矩陣Ii1,在Ii1上隨機(jī)截取side×side大小的窗口,然后對窗口內(nèi)的元素進(jìn)行去平均化,得到side×side的矩陣Ii1’;
3-1-3)在CNNj1網(wǎng)絡(luò)模型中輸入Ii1’,然后從模型倒數(shù)第二個全連接層的x個1×1大小的神經(jīng)元中輸出圖像特征,組成x維的特征向量wi1,并保存到特征矩陣W的第i1行;
3-1-4)令i1=i1+1,轉(zhuǎn)步驟3-1-2)重復(fù)執(zhí)行上述步驟,直到i1=n;
步驟五中,用CNNj1提取檢索圖片集中每張圖片的特征向量,組成檢索圖片集對應(yīng)的特征矩陣的方法與步驟三中相同。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于湘潭大學(xué),未經(jīng)湘潭大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710598424.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:用于輸出信息的方法和裝置
- 下一篇:認(rèn)證異常判斷方法及裝置
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計算機(jī)可讀存儲介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計算機(jī)設(shè)備和存儲介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲介質(zhì)
- 文本生成方法、裝置和電子設(shè)備





