[發明專利]一種基于少量問卷調查數據的多目標特征預測方法在審
| 申請號: | 202010530453.0 | 申請日: | 2020-06-11 |
| 公開(公告)號: | CN111815030A | 公開(公告)日: | 2020-10-23 |
| 發明(設計)人: | 董雪梅;孔旭東 | 申請(專利權)人: | 浙江工商大學 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06K9/62;G06N3/08;G06F17/16;G06F17/18 |
| 代理公司: | 杭州天昊專利代理事務所(特殊普通合伙) 33283 | 代理人: | 董世博 |
| 地址: | 310018 浙江省杭州市江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 少量 問卷調查 數據 多目標 特征 預測 方法 | ||
一種基于少量問卷調查數據的多目標特征預測方法,包括如下步驟:S1:整理問卷調查數據;S2:使用k?means方法對步驟S1中缺失數據進行插補;S3:通過獨熱編碼和編碼標簽將步驟S2中補充后的非數值型特征轉換為數值型特征;S4:將步驟S3中轉換得到的數值型特征與任意一個想要預測的目標特征進行關聯,稱為一個任務;建立基于隨機配置徑向基網絡的多任務監督學習模型,并對多個任務進行預測;S5:根據步驟S4建立模型的輸出結果,得到最終的預測結果;本發明通過利用多個目標特征之間的關聯性,挖掘存在于模型參數或數據特征中的共有信息,以解決問卷調查數據不足的問題。
技術領域
本發明涉及問卷數據分析領域,特別是涉及一種基于少量問卷調查數據的多目標特征預測方法。
背景技術
目前,線下的問卷調查在實際生活中的運用越來越少,問卷調查的逐漸由線下轉為線上,主要包括以下幾點原因:其一,問卷的回收率低,尤其是問卷調查中還存在惡意丟棄問卷的現象,非但浪費了問卷,而且一定程度上還導致了環境的污染;其二,問卷內容轉化為數據的成本高,包括兩部分,一部分是問卷的印制成本高,另一部分是問卷分發的人力成本和時間成本高;其三,問卷調查收集的數據量少。上述線下問卷調查的前兩個弊端都會直接導致第三個弊端,而問卷的數據量少會直接導致問卷調查結果不準確,失去或偏離了問卷調查的意義。因此急需一種方法能夠基于少量的問卷調查數據對多個目標特征進行準確的預測,其中目標特征指的是問卷想要獲取的指標,比如居民收入區間的分布和比例、居民消費傾向等等。
發明內容
本發明的目的是解決現有技術的不足,提供一種基于少量問卷調查數據的多目標特征預測方法,原理簡單,預測準確。
一種基于少量問卷調查數據的多目標特征預測方法,包括如下步驟:
S1:整理問卷調查數據;
S2:使用k-means方法對步驟S1中缺失數據進行插補;
S3:通過獨熱編碼和編碼標簽將步驟S2中補充后的非數值型特征轉換為數值型特征;
S4:將步驟S3中轉換得到的數值型特征與任意一個想要預測的目標特征進行關聯,稱為一個任務;建立基于隨機配置徑向基網絡的多任務監督學習模型,并對多個任務進行預測;
S5:根據步驟S4建立模型的輸出結果,得到最終的預測結果。
進一步的,所述步驟S4中,基于隨機配置徑向基網絡的多任務監督學習模型的建立包括如下步驟:
步驟S41:整理任務的輸入數據和輸出數據,使其滿足模型的要求;設定已經具有L-1個隱藏層節點的通用模型,L=1,2,3,…,L為初始的設定值,該通用模型作為初始的通用模型;
步驟S42:將通用模型轉換為應用模型,并根據實際輸出數據與應用模型的輸出數據做差,得到殘差矩陣;
步驟S43:根據殘差矩陣計算均方根誤差,并與預先設定的誤差進行比較;若滿足誤差要求,則模型建立完成,結束步驟;若不滿足要求,則進入步驟S44;
步驟S44:通過配置滿足設定要求的隨機參數,增加一個新的隱藏層節點;
步驟S45:根據步驟S44的參數得到新的通用模型,返回步驟S42。
進一步的,所述步驟S41中,
首先由步驟S3轉換得到的數值型特征與任意一個想要預測的目標特征進行關聯,得到M個任務,其中要求每個任務的樣本數量相同,N1=N2=…=NM= N,N表示樣本數量,N1、N2…NM分別對應各個任務;若任務的樣本數量不同,則對該任務內的樣本進行隨機采樣,使其滿足樣本數量相等的要求;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江工商大學,未經浙江工商大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010530453.0/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





