[發明專利]一種科技項目申報線上服務終端在審
| 申請號: | 202010015896.6 | 申請日: | 2020-01-08 |
| 公開(公告)號: | CN110807449A | 公開(公告)日: | 2020-02-18 |
| 發明(設計)人: | 江峰;李縉航 | 申請(專利權)人: | 杭州皓智天誠信息科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06T5/00;G06T5/20;G06T7/13;G06T7/155 |
| 代理公司: | 杭州創智卓英知識產權代理事務所(普通合伙) 33324 | 代理人: | 鄭思思 |
| 地址: | 310000 浙江省杭州市余杭*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 科技 項目 申報 線上 服務 終端 | ||
1.一種科技項目申報線上服務終端,包括資料收集單元、資料預檢查單元和信息查詢單元,其特征在于:所述資料收集單元用于對申報的科技項目數據資料進行收集和歸類,所述資料預檢查單元用于對申報的科技項目數據資料進行預處理檢查,所述信息查詢單元用于對申報的科技項目數據資料處理流程溯源信息進行查詢。
2.根據權利要求1所述的科技項目申報線上服務終端,其特征在于:所述資料收集單元包括如下流程步驟:
S1.1、錄入數據:錄入科技項目數據;
S1.2、提取名稱:提取錄入的科技項目名稱數據;
S1.3、提取關鍵字:提取科技項目名稱數據中的關鍵詞;
S1.4、數據分類:根據提取關鍵字的相似度對錄入科技項目數據進行分類。
3.根據權利要求2所述的科技項目申報線上服務終端,其特征在于:所述S1.2中,提取名稱選用邊緣文字檢測算法,其算法流程如下:
S1.2.1、使用邊緣檢測算子檢測出名稱文字邊緣特征;
S1.2.2、對邊緣特征進行濾波處理;
S1.2.3、通過形態學操作將邊緣合并呈區域;
S1.2.4、根據水平投影算法提取文字區域。
4.根據權利要求3所述的科技項目申報線上服務終端,其特征在于:所述邊緣檢測算子采用Sobel算子檢測文字邊緣特征,其算子公式為:
(1)
(2)
K代表鄰域點標記矩陣模板,以(i,j)為中心3×3 鄰域矩陣,a為是條件中的控制因子,取值范圍為0至1,通過多個的a取值來控制邊緣的寬度;
矩陣(1)、(2)和(3)分別為該算子的X向卷積模板、Y向卷積模板以及待處理點的鄰域點標記矩陣。
5.根據權利要求3所述的科技項目申報線上服務終端,其特征在于:所述邊緣特征進行濾波處理采用高斯濾波處理,其公式如下:
其中,高斯濾波器寬度,決定著平滑程度,x為坐標,控制高斯核形狀。
6.根據權利要求3所述的科技項目申報線上服務終端,其特征在于:所述水平投影算法的公式如下:
其中,E表示文本區域的邊緣圖,是圖像中像素點的坐標,h為圖像的高度,為橫坐標為的水平投影。
7.根據權利要求2所述的科技項目申報線上服務終端,其特征在于:所述S1.3中,提取關鍵字采用TFIDF算法,其算法流程如下:
S1.3.1、先給本聚類內的所有文檔進行分詞,然后用一個字典保存每個詞出現的次數;
S1.3.2、遍歷每個詞,得到每個詞在所有文檔里的IDF值以及在本聚類內出現的次數TF相乘的值;
S1.3.3、用一個字典來保存所有的詞信息,然后按value對字典排序,最后取權重排名靠前的幾個詞作為關鍵詞。
8.根據權利要求2所述的科技項目申報線上服務終端,其特征在于:所述關鍵字的相似度采用漢明距離的文本相似度計算方法,其計算方法公式如下:
其中,表示模2加運算, 表示兩碼字在相同位置上不同碼符號的數目的總和,n為兩個長碼字之間的距離,k為碼字個數。
9.根據權利要求2所述的科技項目申報線上服務終端,其特征在于:所述數據分類采用K-means聚類算法,其方法步驟如下:
S1.4.1、對于等待聚類的文本集D,確定要生成的簇的數目k;
S1.4.2、生成k個聚類中心作為聚類的初始中心點,;
S1.4.3、對D中的每一個文本,依次計算它與各個中心點的相似度;
S1.4.4、選取具有最大的相似度的中心點,將歸入以為聚類中心的簇,從而得到D一個聚類;
S1.4.5、重新確定每個簇的中心點;
S1.4.6、反復執行S1.4.3-S1.4.5,到中心點不再改變,文本不再重新被分配為止。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州皓智天誠信息科技有限公司,未經杭州皓智天誠信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010015896.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:威脅信息處理方法、裝置、電子設備及介質
- 下一篇:異常預警方法及相關設備





