[實用新型]一種基于藏文句子級別的藏文論文復制檢測系統有效
| 申請號: | 201621006813.2 | 申請日: | 2016-08-31 |
| 公開(公告)號: | CN206451175U | 公開(公告)日: | 2017-08-29 |
| 發明(設計)人: | 看不太;安見才讓;孫琦龍;昝風彪 | 申請(專利權)人: | 青海民族大學 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06F17/30;G06F17/22;G06F17/28 |
| 代理公司: | 北京酷愛智慧知識產權代理有限公司11514 | 代理人: | 趙永輝 |
| 地址: | 810007 青*** | 國省代碼: | 青海;63 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 藏文 句子 級別 論文 復制 檢測 系統 | ||
1.一種基于藏文句子級別的藏文論文復制檢測系統,其特征在于,所述系統包括可訪問因特網的客戶終端,通過因特網連接到所述客戶終端服務器的藏文論文復制檢測裝置,以及連接到所述服務器存儲的藏文論文的數據庫;所述藏文論文復制檢測裝置包括:
從藏文論文的數據庫提取待檢測藏文論文文本字符做編碼轉換及去除噪音的通過因特網連接到所述客戶終端的服務器中預處理模塊;
所述客戶終端的服務器中預處理模與基于藏文句子邊界識別藏文論文文本并按句子分成文本塊,構建文本塊分詞的分詞臨時表模塊連接;
所述分詞臨時表模塊與在句子-文檔倒排索引表和文本塊分詞的臨時表中,得到句子文本特征的特征提取模塊連接;
所述特征提取模塊與利用鄰接表獲得文本塊相似值來檢測兩篇藏文論文存在的復制數據的復制檢測模塊連接。
2.根據權利要求1所述的基于藏文句子級別的藏文論文復制檢測系統,其特征在于,所述藏文論文文本文件編碼轉換成Unicode編碼。
3.根據權利要求1所述的基于藏文句子級別的藏文論文復制檢測系統,其特征在于,所述句子的文本特征由句子中的停單詞、格助詞和虛詞組成。
4.根據權利要求1所述的基于藏文句子級別的藏文論文復制檢測系統,其特征在于,用待測藏文論文每條句子相似度的向量集的每個元素表示待測藏文論文對應的句子相似度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于青海民族大學,未經青海民族大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201621006813.2/1.html,轉載請聲明來源鉆瓜專利網。





