[發明專利]對小樣本學習任務生成集成分類器的可視分析系統和方法在審
| 申請號: | 202110542475.3 | 申請日: | 2021-05-18 |
| 公開(公告)號: | CN113344038A | 公開(公告)日: | 2021-09-03 |
| 發明(設計)人: | 劉世霞;楊維鎧;張幸幸;肖嵐茜;朱軍 | 申請(專利權)人: | 清華大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/08;G06N20/20 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 王萌 |
| 地址: | 10008*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 樣本 學習 任務 生成 集成 分類 可視 分析 系統 方法 | ||
1.一種用于對小樣本學習任務生成集成分類器的可視分析系統,該系統包括:
接收模塊,被配置為接收多個基學習器和多個樣本,所述多個樣本中包含有限數量的有標注樣本;
基學習器選擇模塊,被配置為根據所述多個基學習器和所述多個樣本,選擇適合所述小樣本學習任務的基學習器;
樣本選擇模塊,被配置為根據選擇的基學習器和所述多個樣本,選擇適合所述小樣本學習任務的有標注樣本;
集成分類器生成模塊,被配置為根據所述選擇的基學習器和選擇的有標注樣本,生成集成分類器;以及
可視化模塊,被配置為顯示所述集成分類器對所述多個樣本的分類結果。
2.根據權利要求1所述的系統,其中所述基學習器選擇模塊被進一步配置為通過計算所述多個基學習器中每個基學習器和所述多個樣本中每個樣本之間的不相似度、所述多個基學習器中任意兩個基學習器之間的不合作度、所述多個基學習器中每個基學習器的代價,選擇適合所述小樣本學習任務的基學習器。
3.根據權利要求1所述的系統,其中所述樣本選擇模塊被進一步配置為通過計算所述多個樣本中任意兩個樣本之間的不相似度、所述多個樣本中的每個樣本的代價,選擇適合所述小樣本學習任務的有標注樣本。
4.根據權利要求1所述的系統,其中所述樣本選擇模塊被進一步配置為通過計算所述多個樣本中任意兩個樣本之間的不相似度、所述多個樣本中的每個樣本的代價,選擇適合所述小樣本學習任務的無標注樣本;
其中所述集成分類器生成模塊被進一步配置為利用生成的集成分類器對選擇的無標注樣本進行類別標注;
其中所述可視化模塊被進一步配置為接收輸入以對所述選擇的無標注樣本的所述生成的集成分類器的所述類別標注進行類別標注驗證,以使其成為另一組有標注樣本;以及
其中所述集成分類器生成模塊被進一步配置為根據所述選擇的基學習器和所述選擇的有標注樣本及所述另一組有標注樣本,生成改進的集成分類器。
5.根據權利要求4所述的系統,其中所述可視化模塊被進一步配置為使用降維算法對所述多個樣本進行降維,將所述多個樣本的降維結果轉化為二維的散點圖,其中使用圖形表示樣本,使用圖形的屬性表示所述集成分類器對所述多個樣本分類的類別標注;其中所述可視化模塊還被進一步配置為接收輸入以調整所述用于生成所述改進的集成分類器的有標注樣本的類別標注,以形成調整的有標注樣本,并且其中所述集成分類器生成模塊被進一步配置為根據所述調整的有標注樣本生成進一步改進的集成分類器。
6.根據權利要求5所述的系統,其中所述可視化模塊進一步包括:
基學習器可視化模塊,被配置為使用基于矩陣的視圖顯示所述多個基學習器和所述集成分類器對所述多個樣本的分類結果的差異,其中所述矩陣的每個單元使用圖形來展示所述多個基學習器和所述集成分類器對所述多個樣本的分類結果的差異,其中使用圖形的第一屬性表示被所述多個基學習器或所述集成分類器分類為一個特定類別的樣本的總數量,使用圖形的第二屬性表示僅被所述多個基學習器分類為一個特定類別的樣本的數量、僅被所述集成分類器分類為一個特定類別的樣本的數量、同時被所述多個基學習器和所述集成分類器分類為一個特定類別的樣本的數量;
其中所述基學習器可視化模塊被進一步配置為接收輸入以調整所述選擇的基學習器,以形成調整的基學習器;并且
其中所述集成分類器生成模塊被進一步配置為根據所述調整的基學習器生成更進一步改進的集成分類器。
7.根據權利要求1-6之一所述的系統,其中所述樣本的類型包括以下之一:
表格數據;
圖像數據;
視頻數據;
文本數據;以及
用戶指定數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學,未經清華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110542475.3/1.html,轉載請聲明來源鉆瓜專利網。





