[發(fā)明專(zhuān)利]一種公式抄襲檢測(cè)方法及系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 201610021492.1 | 申請(qǐng)日: | 2016-01-13 |
| 公開(kāi)(公告)號(hào): | CN105701087B | 公開(kāi)(公告)日: | 2018-03-16 |
| 發(fā)明(設(shè)計(jì))人: | 夏峰 | 申請(qǐng)(專(zhuān)利權(quán))人: | 夏峰 |
| 主分類(lèi)號(hào): | G06F17/27 | 分類(lèi)號(hào): | G06F17/27;G06F17/30 |
| 代理公司: | 北京冠和權(quán)律師事務(wù)所11399 | 代理人: | 朱健,陳國(guó)軍 |
| 地址: | 410000 湖南省長(zhǎng)沙市芙蓉區(qū)荷*** | 國(guó)省代碼: | 湖南;43 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 公式 抄襲 檢測(cè) 方法 系統(tǒng) | ||
1.一種公式抄襲檢測(cè)系統(tǒng),其特征在于,包括:
對(duì)比庫(kù),用于收錄用作對(duì)比對(duì)象的素材;所述對(duì)比庫(kù)進(jìn)一步包括書(shū)籍庫(kù)、論文庫(kù)、專(zhuān)利庫(kù)、公式庫(kù)、諺語(yǔ)俗語(yǔ)庫(kù)、諺語(yǔ)庫(kù)、名人名言庫(kù)、詩(shī)詞庫(kù)子庫(kù);
對(duì)比庫(kù)在收錄素材時(shí),對(duì)所收錄的素材中存在的公式進(jìn)行提取復(fù)制,并建立公式庫(kù)進(jìn)行單獨(dú)保存;所述公式庫(kù)中的每個(gè)公式都與其被提取的素材建立有關(guān)聯(lián)關(guān)系,通過(guò)公式庫(kù)中的公式即可獲取其對(duì)應(yīng)的素材全文;在收錄公式時(shí),將公式的各自變量參數(shù)以及因變量參數(shù)以及運(yùn)算符號(hào)分別進(jìn)行提取保存;提取出公式的各自變量參數(shù)以及因變量參數(shù)后進(jìn)一步提取各參數(shù)的具體含義、量綱以及取值范圍,并分別進(jìn)行保存;提取出公式的運(yùn)算符號(hào)后,進(jìn)一步對(duì)運(yùn)算符加以中外文文字注釋?zhuān)?/p>
分詞庫(kù),用于收錄分詞及對(duì)應(yīng)詞性;分詞庫(kù)中針對(duì)每一分詞進(jìn)行唯一編號(hào),使用W_ID表示某一分詞在分詞庫(kù)中的唯一編號(hào);
分詞模塊,用于對(duì)各素材進(jìn)行分詞,并將分詞結(jié)果保存至對(duì)比庫(kù)中;分詞模塊將分詞結(jié)果與分詞庫(kù)保存的詞性進(jìn)行比對(duì),確定分詞結(jié)果的詞性;
分詞特征值生成模塊統(tǒng)計(jì)每一個(gè)分詞在對(duì)應(yīng)素材中出現(xiàn)的數(shù)量,生成每一個(gè)分詞對(duì)應(yīng)的分詞詞性特征值WCCV=[W_ID,W_N,W_CHAR],WCV=[W_ID,W_N],其中W_ID表示該分詞在分詞庫(kù)中的唯一編號(hào),W_N表示該分詞在該素材中出現(xiàn)的總次數(shù);W_CHAR表示該分詞的詞性;
分詞自由向量維數(shù)確定模塊根據(jù)素材的分詞結(jié)果確定分詞自由向量維數(shù)WFV;所述分詞自由向量維數(shù)WFV等于對(duì)特定素材進(jìn)行分詞后得到的不同分詞的數(shù)量;
分詞精簡(jiǎn)向量維數(shù)生成模塊,用于對(duì)每個(gè)素材的分詞自由向量維數(shù)WFV進(jìn)行精簡(jiǎn),生成分詞精簡(jiǎn)向量維數(shù)RWV;
分詞特征向量生成模塊,用于根據(jù)分詞精簡(jiǎn)向量維數(shù)RWV提取每個(gè)素材中所述分詞精簡(jiǎn)向量維數(shù)RWV對(duì)應(yīng)的特征值生成分詞特征向量WVE_RWV;
WVE_RWV=[W_ID1,W_N1,...,W_IDi,W_Ni,...,W_IDRWV,W_NRWV]
其中W_IDi表示分詞在分詞庫(kù)中的唯一編號(hào),W_Ni,表示該分詞在該素材中出現(xiàn)的總次數(shù),將該次數(shù)作為該分詞的特征值;
用戶(hù)訪問(wèn)方式檢測(cè)模塊,用于提示用戶(hù)上傳待鑒定文檔;
用戶(hù)檢測(cè)模式確定模塊,用于判斷當(dāng)前用戶(hù)檢測(cè)模式為普通抄襲鑒定模式時(shí),待鑒定文檔分詞模塊用于對(duì)待鑒定文檔進(jìn)行分詞,得到分詞結(jié)果;
待鑒定文檔分詞自由向量維數(shù)確定模塊,用于根據(jù)待鑒定文檔的分詞結(jié)果確定分詞自由向量維數(shù)WFV_TBI;
待鑒定文檔分詞精簡(jiǎn)向量維數(shù)生成模塊,用于對(duì)待鑒定文檔的分詞自由向量維數(shù)WFV_TBI進(jìn)行精簡(jiǎn);生成待鑒定文檔分詞精簡(jiǎn)向量維數(shù)RWV_TBI;
待鑒定文檔分詞特征向量生成模塊,根據(jù)分詞精簡(jiǎn)向量維數(shù)RWV_TBI提取每個(gè)待鑒定文檔中與所述待鑒定文檔分詞精簡(jiǎn)向量維數(shù)RWV_TBI對(duì)應(yīng)的特征值生成待鑒定文檔分詞特征向量WVE_RWV_TBI,其中
WVE_RWV_TBI=[W_ID1,W_N1,...,W_IDi,W_Ni,...,W_IDRWV_TBI,W_NRWV_TBI]
其中W_IDi表示分詞在分詞庫(kù)中的唯一編號(hào),W_Ni表示該分詞在該待鑒定文檔中出現(xiàn)的總次數(shù),將該次數(shù)作為該分詞的特征值;
用戶(hù)檢測(cè)模式確定模塊判斷當(dāng)前用戶(hù)檢測(cè)模式為普通抄襲鑒定模式時(shí),進(jìn)行相似度比對(duì)時(shí),待鑒定文檔分詞特征向量生成模塊生成待鑒定文檔的分詞特征向量WVE_RWV_TBI;WVE_RWV_TBI=[W_ID1,W_N1,...,W_IDi,W_Ni,...,W_IDRWV_TBI,W_NRWV_TBI],待鑒定文檔的分詞特征向量的維數(shù)為RWV_TBI;分詞特征向量生成模塊生成對(duì)比庫(kù)中素材的分詞特征向量WVE_RWV;WVE_RWV=[W_ID1,W_N1,...,W_IDi,W_Ni,...,W_IDRWV,W_NRWV];其中,待鑒定文檔的分詞特征向量的維數(shù)RWV_TBI等于分詞特征向量的維數(shù)RWV;
待鑒定文檔特征向量調(diào)整模塊,用于將分詞特征向量WVE_RWV_TBI中的所有特征值對(duì)應(yīng)的W_IDi值按照分詞庫(kù)中的編號(hào)進(jìn)行升序或降序排列,并將缺少的W_IDi值插入,插入的分詞編號(hào)W_IDi所對(duì)應(yīng)的特征值為0;得到擴(kuò)展的待鑒定文檔分詞特征向量WVE_RWV_TBI_EXT=[W_IDTBI_EXT_1,W_NTBI_EXT_1,...,W_IDTBI_EXT_i,W_NTBI_EXT_i,...,W_IDTBI_EXT_RWV_TBI,W_NTBI_EXT_RWV_TBI,...,W_IDW,W_NW];
素材特征向量調(diào)整模塊,用于將分詞特征向量WVE_RWV中的所有特征值對(duì)應(yīng)的W_IDi值按照分詞庫(kù)中的編號(hào)進(jìn)行升序或降序排列,并將缺少的W_IDi值插入,插入的分詞編號(hào)W_IDi所對(duì)應(yīng)的特征值為0;得到擴(kuò)展的分詞特征向量WVE_RWV_EXT=[W_IDEXT_1,W_NEXT_1,...,W_IDEXT_i,W_NEXT_i,...,W_IDEXT_RWV,W_NEXT_RWV,...,W_IDW,W_NW];
普通抄襲鑒定相似度計(jì)算模塊,計(jì)算待鑒定文檔與對(duì)比庫(kù)中的任一素材的之間的相似度;通過(guò)以下公式計(jì)算:
當(dāng)待鑒定文檔與所有素材對(duì)比完成后,提取所有疑似素材,將待鑒定文檔與疑似素材進(jìn)行進(jìn)一步對(duì)比。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于夏峰,未經(jīng)夏峰許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610021492.1/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 檢測(cè)裝置、檢測(cè)方法和檢測(cè)組件
- 檢測(cè)方法、檢測(cè)裝置和檢測(cè)系統(tǒng)
- 檢測(cè)裝置、檢測(cè)方法以及記錄介質(zhì)
- 檢測(cè)設(shè)備、檢測(cè)系統(tǒng)和檢測(cè)方法
- 檢測(cè)芯片、檢測(cè)設(shè)備、檢測(cè)系統(tǒng)和檢測(cè)方法
- 檢測(cè)裝置、檢測(cè)設(shè)備及檢測(cè)方法
- 檢測(cè)芯片、檢測(cè)設(shè)備、檢測(cè)系統(tǒng)
- 檢測(cè)組件、檢測(cè)裝置以及檢測(cè)系統(tǒng)
- 檢測(cè)裝置、檢測(cè)方法及檢測(cè)程序
- 檢測(cè)電路、檢測(cè)裝置及檢測(cè)系統(tǒng)
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





