[發(fā)明專利]一種基于圖像分區(qū)進(jìn)行大數(shù)據(jù)匹配計(jì)算的科技項(xiàng)目查重方法在審
| 申請(qǐng)?zhí)枺?/td> | 201910972656.2 | 申請(qǐng)日: | 2019-10-14 |
| 公開(kāi)(公告)號(hào): | CN110929069A | 公開(kāi)(公告)日: | 2020-03-27 |
| 發(fā)明(設(shè)計(jì))人: | 謝積鑒;陳旭紅;粟月萍;鐘雪梅;胡婷婷;玉泉;陳金平;李榮;陳怡玲;盧琳玲 | 申請(qǐng)(專利權(quán))人: | 廣西壯族自治區(qū)科學(xué)技術(shù)情報(bào)研究所 |
| 主分類號(hào): | G06F16/535 | 分類號(hào): | G06F16/535;G06F16/538;G06F16/583;G06F16/335;G06F16/338 |
| 代理公司: | 南寧曙華知識(shí)產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 45121 | 代理人: | 鄭進(jìn)城 |
| 地址: | 530022 廣西壯*** | 國(guó)省代碼: | 廣西;45 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 圖像 分區(qū) 進(jìn)行 數(shù)據(jù) 匹配 計(jì)算 科技 項(xiàng)目 方法 | ||
本發(fā)明公開(kāi)了一種基于圖像分區(qū)進(jìn)行大數(shù)據(jù)匹配計(jì)算的科技項(xiàng)目查重方法,包括以下步驟:第一步,將現(xiàn)有科技項(xiàng)目資料進(jìn)行解析,分別建立相應(yīng)的圖片庫(kù)和文本庫(kù);第二步,對(duì)圖片庫(kù)中的圖片進(jìn)行分割,依據(jù)分割算法將圖片劃分為不同區(qū)域;第三步,獲取圖片及區(qū)域內(nèi)部特征信息;第四步,將預(yù)立項(xiàng)的科研項(xiàng)目資料進(jìn)行解析,抽取其中的圖片,并對(duì)其進(jìn)行圖片分割;第五步,將現(xiàn)有科技項(xiàng)目的特征信息與預(yù)立項(xiàng)的科研項(xiàng)目進(jìn)行比對(duì),按圖片特征信息相似度和特征信息的權(quán)重得到現(xiàn)有科技項(xiàng)目與預(yù)立項(xiàng)的科研項(xiàng)目的重合值,按重合值的大小進(jìn)行排序得到第一查重結(jié)果。本發(fā)明可以提高科技項(xiàng)目的查重率,有效避免漏檢或者錯(cuò)檢。
技術(shù)領(lǐng)域
本發(fā)明涉及圖像處理技術(shù)領(lǐng)域,特別是一種基于圖像分區(qū)進(jìn)行大數(shù)據(jù)匹配計(jì)算的科技項(xiàng)目查重方法。
背景技術(shù)
據(jù)統(tǒng)計(jì),我國(guó)科研項(xiàng)目重復(fù)率達(dá)40%,,另外60%中與國(guó)外重復(fù)的約占30%以上。重復(fù)立項(xiàng)不僅造成科技資源的大量浪費(fèi),也導(dǎo)致科研活動(dòng)的無(wú)序發(fā)展和大量低水平重復(fù),嚴(yán)重?fù)p害開(kāi)拓創(chuàng)新的科研精神,阻礙國(guó)家科技發(fā)展的步伐。
目前,已有學(xué)者研究了一些項(xiàng)目查重的方法和機(jī)制問(wèn)題,取得了一定的進(jìn)展。常用的項(xiàng)目查重方法主要有以下4類:基于非分詞技術(shù)的科技項(xiàng)目查重方法、基于TF-IDF值算法的科技項(xiàng)目查重方法、基于層次聚類的科技項(xiàng)目分類與查重方法、基于科技項(xiàng)目申報(bào)與審批流程進(jìn)行的項(xiàng)目查重方法。
基于非分詞技術(shù)解決科技項(xiàng)目查重問(wèn)題的方法,該方法不需要對(duì)文本進(jìn)行分詞處理,而是利用頻繁閉項(xiàng)集構(gòu)造向量空間模型對(duì)項(xiàng)目申請(qǐng)書(shū)進(jìn)行建模并計(jì)算相似度。這種方法通過(guò)計(jì)算科技項(xiàng)目申請(qǐng)書(shū)之間的相似度,從而達(dá)到項(xiàng)目查重的目的。
基于TF-IDF值算法的科技項(xiàng)目查重方法,該方法是通過(guò)使用特征向量模型的方法對(duì)科技項(xiàng)目申報(bào)文本進(jìn)行分詞及權(quán)重計(jì)算,對(duì)特征進(jìn)行排序選取。
基于層次聚類的科技項(xiàng)目分類與查重方法,該方法是在計(jì)算科技項(xiàng)目相似性時(shí)綜合考慮了應(yīng)用領(lǐng)域、研究?jī)?nèi)容和技術(shù)來(lái)源等因素,從而利用了項(xiàng)目本體相似度來(lái)計(jì)算模型和層次聚類的結(jié)果,以此提高查重的高效性與科學(xué)性。
基于科技項(xiàng)目申報(bào)與審批流程進(jìn)行的項(xiàng)目查重方法,該方法通過(guò)對(duì)科研項(xiàng)目的申報(bào)與審批流程進(jìn)行分析,提出避免重復(fù)立項(xiàng)的具體措施。
上述現(xiàn)有技術(shù)存在以下問(wèn)題:都是通過(guò)文本相似度來(lái)進(jìn)行科技項(xiàng)目查重,但現(xiàn)有科技項(xiàng)目成果表現(xiàn)形式如論文、專著或者專利都是各種語(yǔ)言進(jìn)行撰寫(xiě),對(duì)于同一主題的語(yǔ)言表達(dá)方式差異巨大,過(guò)分依賴查重人員的語(yǔ)言水平,很難避免漏檢或者錯(cuò)檢。而論文、專著或者專利中的附圖,卻有著固定的格式。但是,現(xiàn)有的科技項(xiàng)目查重中,尚未有將圖片相似度作為科技項(xiàng)目查重手段的報(bào)道。
CN104915955A
發(fā)明內(nèi)容
本發(fā)明的目的是解決上述現(xiàn)有技術(shù)的問(wèn)題,提出了一種基于圖像分區(qū)進(jìn)行大數(shù)據(jù)匹配計(jì)算的科技項(xiàng)目查重方法,可以輔助文本相似度的查重方式,提高科技項(xiàng)目的查重率,有效避免漏檢或者錯(cuò)檢。
為達(dá)到上述發(fā)明目的,本發(fā)明所述的一種基于圖像分區(qū)進(jìn)行大數(shù)據(jù)匹配計(jì)算的科技項(xiàng)目查重方法,本發(fā)明是以如下技術(shù)方案實(shí)現(xiàn)的:
第一步,將現(xiàn)有科技項(xiàng)目資料進(jìn)行解析,分別建立相應(yīng)的圖片庫(kù)和文本庫(kù);
第二步,對(duì)圖片庫(kù)中的圖片進(jìn)行分割,依據(jù)分割算法將圖片劃分為不同區(qū)域;
第三步,獲取圖片及區(qū)域內(nèi)部特征信息,特征信息包括:區(qū)域中的HSV的H值方圖、線條信息;
第四步,將預(yù)立項(xiàng)的科研項(xiàng)目資料進(jìn)行解析,抽取其中的圖片,并對(duì)其進(jìn)行圖片分割,獲取圖片及區(qū)域內(nèi)部特征信息。
第五步,將現(xiàn)有科技項(xiàng)目按第二步和第三步獲取的特征信息與預(yù)立項(xiàng)的科研項(xiàng)目按第四步獲取的分割區(qū)域進(jìn)行比對(duì),按圖片特征信息相似度和特征信息的權(quán)重得到現(xiàn)有科技項(xiàng)目與預(yù)立項(xiàng)的科研項(xiàng)目的第一重合值,按第一重合值的大小進(jìn)行排序得到第一查重結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣西壯族自治區(qū)科學(xué)技術(shù)情報(bào)研究所,未經(jīng)廣西壯族自治區(qū)科學(xué)技術(shù)情報(bào)研究所許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910972656.2/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 一種磁盤(pán)分區(qū)故障修復(fù)方法及裝置
- 母盤(pán)制作方法及裝置
- 母盤(pán)制作方法及裝置
- 分區(qū)訪問(wèn)方法和電子設(shè)備
- 基于閃存存儲(chǔ)的系統(tǒng)、分區(qū)方法和裝置
- 一種適應(yīng)廠站動(dòng)態(tài)分區(qū)的可視化展示方法
- 一種虛擬動(dòng)態(tài)分區(qū)鏡像文件生成方法及系統(tǒng)
- 一種固態(tài)盤(pán)的邏輯分區(qū)實(shí)現(xiàn)方法及裝置
- 一種SSD控制芯片的布版結(jié)構(gòu)
- 一種對(duì)非分區(qū)表進(jìn)行分區(qū)并行讀取的方法及裝置
- 請(qǐng)求沒(méi)有進(jìn)行IMS注冊(cè)的用戶進(jìn)行注冊(cè)的方法
- 對(duì)要進(jìn)行紋理操作的像素進(jìn)行分組
- 對(duì)餐盤(pán)進(jìn)行溫度調(diào)節(jié)和進(jìn)行分配的獨(dú)立小車
- 對(duì)圖像進(jìn)行編碼
- 對(duì)任務(wù)進(jìn)行調(diào)度
- 對(duì)任務(wù)進(jìn)行調(diào)度
- 蛋糕(甜蜜進(jìn)行時(shí))
- 對(duì)定位輔助數(shù)據(jù)進(jìn)行分級(jí)和分組以進(jìn)行廣播
- 對(duì)物體進(jìn)行分離和定向以進(jìn)行供料
- 對(duì)工件進(jìn)行評(píng)價(jià)以進(jìn)行加工的方法





