[發明專利]基于高斯混合模型聚類的自適應雙權重航空旅客付費選座預測方法在審
| 申請號: | 202110600444.9 | 申請日: | 2021-05-31 |
| 公開(公告)號: | CN113361758A | 公開(公告)日: | 2021-09-07 |
| 發明(設計)人: | 陳凱;王百城;龍勝春 | 申請(專利權)人: | 浙江工業大學 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q10/02;G06K9/62 |
| 代理公司: | 杭州斯可睿專利事務所有限公司 33241 | 代理人: | 王利強 |
| 地址: | 310014 浙江省*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 混合 模型 自適應 權重 航空 旅客 付費 預測 方法 | ||
1.一種基于高斯混合模型聚類的自適應雙權重航空旅客付費選座預測方法,其特征在于,所述方法包括以下步驟:
步驟1.使用開源航空旅客數據集或者自行建立數據集,并對數據集進行預處理,過程如下:
1.1)利用Xgboost算法內置特征重要屬性反映特征對模型結果的影響,提取特征重要程度排名前20%的特征,提高模型訓練效率;
1.2)將數據集分為訓練集,測試集;
步驟2:訓練階段,即在訓練集上訓練,過程如下:
2.1)使用貝葉斯搜索方法確定隨機森林分類器的最優超參數;
2.2)使用高斯混合模型對原始數據集進行聚類,并依據BIC模型選擇理論確定最優聚類數量M;
2.3)在各個類簇上訓練隨機森林分類器;
步驟3:測試階段,測試數據為測試集或采集的數據,過程如下:
3.1)運用高斯混合模型預測測試樣本屬于訓練集每一個類簇的概率,并將其表示為向量其中,γe,j表示測試樣本xe屬于第j個類簇的概率,j=1,…,M,M表示類簇數量;訓練集樣本屬于每一個類簇的概率,并將其表示為向量其中,表示第t個類簇中第i個樣本點屬于第j個類簇的概率;
3.2)利用歐氏距離計算第t個類簇中第i個樣本點與測試樣本xe的概率分布的相似程度距離越小,概率分布的相似程度越大,其計算公式為:
其中,M表示類簇數量,表示第t個類簇中第i個樣本點屬于第j個類簇的概率,,j=1,…,M,γe,j表示測試樣本xe屬于第j個類簇的概率;
3.3)由于不同類簇中的樣本數量不同,為此設定最近鄰域的樣本比例k用于確定測試樣本在第t個類簇上的近鄰數量nt,其計算公式為:
nt=Nt×k
其中,Nt為第t個類簇的樣本數量,針對測試樣本點xe,選取第t個類簇中與測試樣本點相似程度最大的nt個點,從而組成第t個類簇的局部評價集合Et;
3.4)計算每一個類簇局部評價集合對各隨機森林分類器的局部適應度其計算公式為
其中,表示隨機森林分類器在第t個類簇的局部評價集合Et上正確分類的樣本點個數;
將局部適應度表示為矩陣FM*M,如下所示:
其中,表示第j個隨機森林分類器對第t個類簇局部評價集合的適應度,j=1,…,M,M表示類簇數量;
3.5)將適應度矩陣與樣本點屬于各個類簇的概率向量Pe相乘,計算得到分類器對測試樣本點的權重ω:
其中,ωe,j表示第j個分類器的權重,j=1,…,M;
3.5)依據加權投票策略輸出測試樣本點的預測標簽q*,其計算公式如下:
其中,M表示類簇數量,ωe,j表示第j個分類器的權重,表示第j個分類器預測標簽q的概率。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江工業大學,未經浙江工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110600444.9/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





