[發明專利]一種基于數據物理特征和隱含風格特征的新穎分類方法在審
| 申請號: | 201910205905.5 | 申請日: | 2019-03-18 |
| 公開(公告)號: | CN109977150A | 公開(公告)日: | 2019-07-05 |
| 發明(設計)人: | 顧蘇杭;王惠宇;高佳琴;王士同 | 申請(專利權)人: | 常州輕工職業技術學院 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458;G06K9/62;G06Q50/00 |
| 代理公司: | 南京正聯知識產權代理有限公司 32243 | 代理人: | 朱曉凱 |
| 地址: | 213164 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 風格特征 測試樣本 社交網絡 隱含 標簽類型 數據物理 子網絡 機器學習技術 人工智能 模式識別 數據距離 雙層結構 效率確定 最大節點 數據集 分類 映射 構建 挖掘 網絡 | ||
本發明涉及模式識別與人工智能、機器學習技術領域,具體地說,是一種基于數據物理特征和隱含風格特征的新穎分類方法,包括以下步驟:(1)利用K近鄰算法將數據集映射成包含C個子網絡的社交網絡;(2)在構建的社交網絡中挖掘數據隱含風格特征—權威性和影響力;(3)根據數據距離特征和權威性風格特征計算每一個測試樣本與社交網絡中每個節點之間的雙層結構效率確定測試樣本每個子網絡的允許連接集;(4)根據允許連接集計算每個允許連接集中所有節點的影響力之和;(5)將測試樣本標簽類型判別為與具有最大節點影響力之和對應的子網絡標簽類型。
技術領域
本發明涉及模式識別與人工智能、機器學習技術領域,具體地說,是一種基于數據物理特征和隱含風格特征的新穎分類方法。
背景技術
數據分類技術在機器學習、模式識別以及數據挖掘等領域一直都是研究的熱點問題,尤其將數據分類技術與實際應用相結合,如智能醫療、人臉識別、智能交通監控、市場動態分析等,更是深遠推動了數據分類技術的發展,拓寬了數據分類技術在軍工業、民生等領域的運用前景。數據分類技術的關鍵就在于選取合適的數據特征通過分類方法構建具有高精度性能的數據分類模型。
傳統分類方法,如支持向量機、K近鄰、隨機森林、貝葉斯、決策樹、人工神經網絡以及Takagi-Sugeno-Kang(TSK)模糊分類器等,利用數據物理特征(如距離、顏色以及相似性等)訓練數據分類模型。然而,大多數實際數據集中的數據樣本之間暗含著關聯,每一類數據樣本呈現獨特的隱含風格特征,典型的數據集包括:(1)癲癇腦電信號:正常人群的腦電信號波形明顯不同于患有癲癇人群的腦電信號;(2)手寫體數據集:每一位作者的字體風格明顯不同于其他作者;(3)元音識別:英文中的每個元音發音互不相同。目前,傳統分類方法在訓練數據分類模型的過程中僅考慮數據物理特征,并沒有涉及數據隱含風格特征,在國內外發表的文獻中未見有一種數據分類方法能夠挖掘數據隱含風格特征,并同時利用數據物理特征和數據隱含風格特征訓練數據分類模型。因而,現有的數據分類方法并不符合數據集包含數據隱含風格特征的事實。
發明內容
本發明的目的旨在提供一種落腳于社交網絡的基于數據物理特征和隱含風格特征的新穎分類方法,能夠符合大多數實際數據集包含數據隱含風格特征的事實,并通過社交網絡挖掘數據隱含風格特征用于改善數據分類行為,提高數據分類精度。而且,該方法在訓練階段不需要生成數據分類模型,確定社交網絡中節點隱含風格特征后便可進入分類階段。
為實現上述目的,本發明的實例提出了一種基于數據物理特征和隱含風格特征的新穎分類方法,包括以下步驟:利用K近鄰算法將數據集映射成包含C個子網絡的社交網絡;在構建的社交網絡中挖掘數據隱含風格特征—權威性和影響力;根據數據距離特征和權威性風格特征計算每一個測試樣本與社交網絡中每個節點之間的雙層結構效率確定測試樣本每個子網絡的允許連接集;根據允許連接集計算每個允許連接集中所有節點的影響力之和;將測試樣本標簽類型判別為與具有最大節點影響力之和對應的子網絡標簽類型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于常州輕工職業技術學院,未經常州輕工職業技術學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910205905.5/2.html,轉載請聲明來源鉆瓜專利網。





