[發明專利]基于t分布混合模型的網絡多媒體業務半監督分類方法有效
| 申請號: | 201710077295.6 | 申請日: | 2017-02-14 |
| 公開(公告)號: | CN106878073B | 公開(公告)日: | 2019-10-08 |
| 發明(設計)人: | 董育寧;趙家杰 | 申請(專利權)人: | 南京郵電大學 |
| 主分類號: | H04L12/24 | 分類號: | H04L12/24;H04L12/26;G06K9/62 |
| 代理公司: | 南京知識律師事務所 32207 | 代理人: | 李湘群 |
| 地址: | 210003 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 分布 混合 模型 網絡 多媒體 業務 監督 分類 方法 | ||
1.基于t分布混合模型的網絡多媒體業務半監督分類方法,其特征在于包含以下步驟:
(1)數據集預處理:采集互聯網上各種多媒體業務的數據流樣本,對數據流樣本進行z-score標準化操作,使數據無量綱化,然后進行特征提取,包括以下步驟:
(1.1)根據數據流樣本,分別采用信息增益、信息增益率、一致性特征選擇方式進行特征選擇,提取出相應的特征組合;
(1.2)對這些特征組合分別進行后續的實驗分析,確定算法對應的較好的特征選擇方法,提取出有效的特征組合;
(1.3)劃分已標識樣本和未標識樣本,采用半監督分類,隨機選取一定比例樣本作為已標識樣本,其余部分作為未標識樣本來檢測實驗效果;
(2)t分布聚類過程:對上述網絡數據流樣本執行t分布混合模型或有限t分布混合模型的擬合工作,得到K個多維t分布聚類,所述t分布聚類過程,具體包括:
(2.1)為了實現聚類過程,首先需要對數據變量進行初始化,設數據樣本為X={x1,...,xN},聚類數為K,包括:
(2.1.1)初始化K個聚類中心,記為μ1,...,μK;
(2.1.2)初始化混合模型參數π1,...,πK取值為1/K;
(2.1.3)使用協方差公式,計算每個混合模型協方差Σ1,...,ΣK;
(2.2)根據μ,Σ和π向量,執行EM算法的E步,具體步驟為:
(2.2.1)根據已求的μ,Σ和π參數,使用貝葉斯公式計算t分布模型的后驗概率;
(2.2.2)如果采用有限t分布混合模型,則需要計算每個樣本點到聚類中心的馬氏距離,根據t分布的3σ準則確定離群噪聲點;
(2.3)根據EM算法的M步,更新μ,Σ和π,具體步驟為:
(2.3.1)如果采用有限t分布混合模型,則需要在計算M步之前,忽略離群噪聲點的影響,否則算法收斂速度較慢;
(2.3.2)根據EM算法的M步公式,更新μ,Σ和π;
(2.4)計算算法的似然函數L(x),如果第k+1次迭代后計算的似然函數L(k+1)(x)與第k次迭代后的似然函數L(k)(x)的差值小于誤差值eps,則算法迭代結束;否則返回步驟2.2;
(3)分類過程:對上述聚類后的結果進一步進行分類,并計算最后分類的總體正確率。
2.根據權利要求1所述的基于t分布混合模型的網絡多媒體業務半監督分類方法,其特征在于所述一定比例為10%。
3.根據權利要求1所述的基于t分布混合模型的網絡多媒體業務半監督分類方法,其特征在于所述t分布混合模型進行擬合包括:
(3.1)初始化聚類中心μ、協方差Σ和混合模型權重π;
(3.2)執行t分布混合模型的EM算法,更新參數;
(3.3)計算EM算法的似然函數,如果第k+1次迭代的似然函數與第k次似然函數之間的差值小于誤差值,則算法迭代結束;否則返回步驟3.2。
4.根據權利要求1所述的基于t分布混合模型的網絡多媒體業務半監督分類方法,其特征在于所述有限t分布混合模型進行擬合包括:
(4.1)計算E步,根據已求的μ,Σ和π參數,使用貝葉斯公式計算后驗概率;
(4.2)計算樣本點到聚類中心的馬氏距離,根據t分布的3σ準則確定離群噪聲點;
(4.3)忽略離群噪聲點的影響,計算M步,更新μ,Σ和π參數。
5.根據權利要求1所述的基于t分布混合模型的網絡多媒體業務半監督分類方法,其特征在于所述分類過程具體分為以下三類:
(5.1)聚類后的簇中沒有已標識的樣本,則這個聚類可視為未知聚類,不在考慮范圍內;
(5.2)聚類后的簇中已標識的樣本的類型僅有一種,則該聚類的所有樣本都劃分為該類型;
(5.3)聚類后的簇中如果含多種已標識的樣本類型,則需要進行進一步的多分類過程。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京郵電大學,未經南京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710077295.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種報文傳輸方法和裝置
- 下一篇:流量過濾方法及裝置





