[發(fā)明專利]信息處理裝置和信息處理方法在審
| 申請?zhí)枺?/td> | 201610405971.3 | 申請日: | 2016-06-08 |
| 公開(公告)號: | CN107480687A | 公開(公告)日: | 2017-12-15 |
| 發(fā)明(設計)人: | 侯翠琴;夏迎炬;徐卓然 | 申請(專利權)人: | 富士通株式會社 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京集佳知識產(chǎn)權代理有限公司11227 | 代理人: | 王萍,陳煒 |
| 地址: | 日本神*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 信息處理 裝置 方法 | ||
1.一種信息處理裝置,包括:
劃分單元,其被配置成將具有標簽的訓練數(shù)據(jù)的集合劃分成第一訓練數(shù)據(jù)集合D1和第二訓練數(shù)據(jù)集合D2,所述第一訓練數(shù)據(jù)集合D1中的訓練數(shù)據(jù)i1的數(shù)目|D1|大于所述第二訓練數(shù)據(jù)集合D2中的訓練數(shù)據(jù)i2的數(shù)目|D2|;
訓練單元,其被配置成使用所述第一訓練數(shù)據(jù)集合D1中的訓練數(shù)據(jù)i1按K個類對M個監(jiān)督模型進行訓練,其中M和K是等于或大于2的自然數(shù);
預測單元,其被配置成使用經(jīng)訓練的M個監(jiān)督模型來預測不具有標簽的待測數(shù)據(jù)集合D3中的每個待測數(shù)據(jù)i3的標簽;
聚類單元,其被配置成使用N個聚類模型對所述第二訓練數(shù)據(jù)集合D2和所述待測數(shù)據(jù)集合D3中的數(shù)據(jù)i進行聚類,其中N是等于或大于2的自然數(shù);
相似度圖構造單元,其被配置成基于所述聚類單元的聚類結果構造所述第二訓練數(shù)據(jù)集合D2和所述待測數(shù)據(jù)集合D3中的數(shù)據(jù)i之間的相似度圖;以及
融合單元,其被配置成基于所述相似度圖對所述待測數(shù)據(jù)集合D3中的每個待測數(shù)據(jù)i3的預測的標簽和所述第二訓練數(shù)據(jù)集合D2中的訓練數(shù)據(jù)i2的標簽進行融合處理以獲得所述待測數(shù)據(jù)集合D3中的每個待測數(shù)據(jù)i3的標簽。
2.根據(jù)權利要求1所述的信息處理裝置,其中
所述預測單元被進一步配置成,針對所述待測數(shù)據(jù)集合D3中的待測數(shù)據(jù)i3,使用M×K矩陣V(i3)表示其標簽預測結果,所述矩陣V(i3)中的每個元素Vmk(i3)表示所述待測數(shù)據(jù)i3被監(jiān)督模型m分類成類k的概率,
其中1≤m≤M,1≤k≤K。
3.根據(jù)權利要求1所述的信息處理裝置,其中
所述聚類單元被進一步配置成,使用(|D2|+|D3|)×L矩陣U來表示其聚類結果,所述矩陣U中的每個元素Uil表示所述第二訓練數(shù)據(jù)集合D2和所述待測數(shù)據(jù)集合D3中的每個數(shù)據(jù)i是否屬于聚類l,當數(shù)據(jù)i屬于聚類l時,Uil=0,否則Uil=1,
其中L是所述N個聚類模型所產(chǎn)生的所有聚類的總數(shù),|D3|是待測數(shù)據(jù)集合D3中的待測數(shù)據(jù)i3的總數(shù),其中N≤l≤L。
4.根據(jù)權利要求3中所述的信息處理裝置,其中
所述相似度圖構造單元被進一步配置成通過對所述聚類單元的聚類結果進行融合以獲得由(|D2|+|D3|)×(|D2|+|D3|)矩陣S表示的相似度圖,所述矩陣S中的每個元素Sij表示所述第二訓練數(shù)據(jù)集合D2和所述待測數(shù)據(jù)集合D3中的數(shù)據(jù)i和數(shù)據(jù)j之間的相似度,其中
5.根據(jù)權利要求4的信息處理裝置,其中
所述相似度圖構造單元被進一步配置成通過下式對所述矩陣S進行歸一化:
其中D是對角矩陣,
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于富士通株式會社,未經(jīng)富士通株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610405971.3/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。





