[發明專利]一種基于神經網絡的院校投檔線預測方法在審
| 申請號: | 201710273724.7 | 申請日: | 2017-04-25 |
| 公開(公告)號: | CN107169593A | 公開(公告)日: | 2017-09-15 |
| 發明(設計)人: | 周從華 | 申請(專利權)人: | 江蘇樹正信息科技有限公司 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q50/20 |
| 代理公司: | 江蘇縱聯律師事務所32253 | 代理人: | 蔡棟 |
| 地址: | 212000 江蘇省*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 神經網絡 院校 投檔線 預測 方法 | ||
技術領域
本發明屬于數據挖掘與大數據分析技術領域,涉及面向院校投檔線的預測技術。
背景技術
各個招生院校的投檔線是在同批次省級招辦劃定的最低控制線(又稱為省控線)的基礎上,根據當年該校在本省的招生計劃、投檔比例、考生報考該院校的志愿分布情況和這些考生的成績分布情況所共同確定的。依據教育部規定,在各個批次的招生錄取中,省級招辦項院校投放考生檔案的比例應控制在1:1~1:1.2之間。
而每年有許多的考生在最后錄取的結果中面臨著高就和低就的問題。所謂高就就是在第一批次錄取的過程中,由于自己的分數不夠,投檔后被退檔而只能進行第二批次的征求平行志愿。所謂低就就是自己的成績比所報考的學校的投檔線高出許多。
隨著互聯網與大數據技術的發展,開發院校投檔線預測技術,能有效降低學生遇到高就和低就的概率,因此,有必要對此技術開展全新的研究。
發明內容
本發明的目的在于提供一種基于神經網絡的院校投檔線預測方法,以提高下一年院校投檔線的預測準確率。
為了解決以上技術問題,本發明采用的技術方案如下。
一種基于神經網絡的院校投檔線預測方法,其特征在于包括以下步驟:
步驟一,對采集到的數據進行缺失值和離群點處理;
步驟二,對經過處理的數據進行歸一化;
步驟三,對數據集進行分類;
步驟四,對分類好的數據集分別建立神經網絡模型進行預測。
所述缺失值和離群點處理包含以下四個規則:
規則1.1,將院校兩線差缺失值設置成其余各年的兩線差均值;
規則1.2,將院校的兩線差離群點設置成其余各年兩線差的均值;
規則1.3,將院校投檔線缺失值設置成該年兩線差與該年省控線之和;
所述歸一化包含以下兩個規則:
規則2.1,對各年兩線差歸一化采用極差法,所取的最小值和最大值是各年兩線差最小值及最大值;
規則2.2,對各年位次歸一化采用極差法,所取的最小值和最大值是各年位次最小值及最大值。
所述對數據集進行分類包含以下三個規則:
規則3.1,篩選出近4年兩線差均為0的院校為訓練集1;
規則3.2,篩選出近4年兩線差均小于5分,且兩線差均不為0的院校,為訓練集2;
規則3.3,計算其余院校4年位次偏差,偏差在0~0.45的院校為訓練集3,偏差在0.45~1的院校為訓練集4,偏差大于1的院校為訓練集5,所述偏差為每年位次減去四年位次均值的絕對值之和比上位次均值的絕對值。
所述建立神經網絡模型包含以下規則:
規則4.1,對訓練集1中的院校默認這些院校下一年的兩線差為0分;
規則4.2,對訓練集2中的院校利用前四年的兩線差歷史數據,采用神經網絡進行建模,其中第四年的數據作為輸出其余均為輸入。
規則4.3,對訓練集35分別利用前四年的位次歷史數據采用神經網絡進行建模,其中第四年的數據作為輸出其余均為輸入。
所述神經網絡模型為雙層隱藏層,第一層隱藏層的神經元不低于20個神經元,第二層隱藏層不低于15個神經元。
本發明具有有益效果。數據分析是保證院校投檔線預測準確的關鍵技術。本發明提出的一種數據預測技術,其特點是充分考慮數據的特征對數據進行分類,通過對采集到的數據進行缺失值和離群點的處理、對經過處理的數據進行歸一化、對數據集進行分類、對分類好的數據集分別進行建模預測等技術方法,顯著提高了院校投檔線預測的準確性。
具體實施方式
下面結合實施例對本發明的技術方案做進一步詳細說明。
以在江蘇省招生的12個院校歷年的數據為例,對這12個院校進行下一年投檔線的預測,表1為這12個院校歷年數據的原始表。
表1 12個院校歷年數據原始表
將表1的信息,依本發明的步驟一進行處理之后,得到表2。
表2.缺失值和離群點處理后的表
將表2的信息,依本發明的步驟二進行處理之后,得到表3。
表3數據歸一化后的表
將表3的信息,依本發明的步驟三進行處理之后,得到表4~8。
表4訓練集1
表5.訓練集2
表6.訓練集3
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江蘇樹正信息科技有限公司,未經江蘇樹正信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710273724.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種方便清潔的家用搗料機
- 下一篇:一種多方位出料的丸子烹煮設備
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





