[發明專利]信息處理裝置、信息處理方法以及信息處理設備在審
| 申請號: | 201610251752.4 | 申請日: | 2016-04-21 |
| 公開(公告)號: | CN107305565A | 公開(公告)日: | 2017-10-31 |
| 發明(設計)人: | 夏迎炬;侯翠琴;徐卓然 | 申請(專利權)人: | 富士通株式會社 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京集佳知識產權代理有限公司11227 | 代理人: | 王萍,陳煒 |
| 地址: | 日本神*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 信息處理 裝置 方法 以及 設備 | ||
1.一種信息處理裝置,包括:
預分類單元,其利用分類器對非標記樣本數據進行分類,以獲得所述非標記樣本數據的預分類標簽;
聚類單元,其對所述非標記樣本數據進行聚類,以獲得所述非標記樣本數據的至少一個簇;
標簽修改單元,針對所述至少一個簇中的每個簇,利用標簽修改優化處理,基于該簇中的非標記樣本數據的一個或多個預分類標簽獲得針對該簇的優化標簽,并將該簇中的非標記樣本數據的預分類標簽全部修改為該優化標簽;以及
優化單元,其利用所述非標記樣本數據以及所述優化標簽,對所述分類器進行優化,
其中,針對所述至少一個簇當中的給定簇中的非標記樣本數據,所述預分類單元獲得了n個預分類標簽,n為大于等于2的自然數,并且其中,所述標簽修改單元通過下述方式針對給定簇進行所述標簽修改優化處理:
基于預先確定的單個標簽修改增益和/或單個標簽修改損失,針對該簇中的非標記樣本數據構建標簽修改優化函數,其中,所述標簽修改優化函數與將該簇中的所有非標記樣本數據的n個預分類標簽全部修改為作為n個預分類標簽之一的候選標簽的總修改代價有關;以及
基于與所述候選標簽相關聯的總修改代價,將獲得所述總修改代價的最優化結果時的候選標簽作為針對該簇的優化標簽。
2.如權利要求1所述的信息處理裝置,其中,所述標簽修改單元通過下述方式獲得所述優化標簽:
針對n個預分類標簽中的每個候選標簽j,
針對除候選標簽j以外的n-1個預分類標簽中的每個標簽i,基于將標簽i修改為標簽j的單個標簽修改增益gij和單個標簽修改損失lij,計算將所述給定簇中的mi個非標記樣本數據的預分類標簽從標簽i修改為標簽j的修改增益Gij=mi·gij和修改損失Lij=mi·lij,并基于Gij和Lij計算修改代價Cij,以及
將針對除候選標簽j以外的n-1個預分類標簽獲得的修改代價求和,得到與候選標簽j相關聯的總修改代價
其中i,j為小于等于n的、互不相等的自然數,并且分別表示n個預分類標簽中的第i個預分類標簽和第j個預分類標簽的編號,mi為自然數并且表示所述給定簇中具有預分類標簽i的非標記樣本數據的個數;以及
基于n個預分類標簽中的每個候選標簽所關聯的總修改代價,構建標簽修改優化函數以及
將滿足的第k個預分類標簽作為所述優化標簽。
3.如權利要求1或2所述的信息處理裝置,其中,所述單個標簽修改增益和/或所述單個標簽修改損失是基于要使用所述分類器的應用的需求而預先確定的。
4.如權利要求1或2所述的信息處理裝置,其中,所述單個標簽修改增益和/或所述單個標簽修改損失是基于所述非標記樣本數據的分布特性而預先確定的。
5.如權利要求1所述的信息處理裝置,其中,所述優化單元利用所述非標記樣本數據以及所述優化標簽來通過重新訓練或增量更新的方式對所述分類器進行優化。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于富士通株式會社,未經富士通株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610251752.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種數據處理的方法和設備
- 下一篇:一種為搜索信息匹配圖片的方法及裝置





