[發(fā)明專利]信息處理設(shè)備、信息處理方法及程序無效
| 申請?zhí)枺?/td> | 201110096344.3 | 申請日: | 2011-04-14 |
| 公開(公告)號: | CN102236692A | 公開(公告)日: | 2011-11-09 |
| 發(fā)明(設(shè)計)人: | 高松慎吾 | 申請(專利權(quán))人: | 索尼公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 康建峰;李春暉 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 信息處理 設(shè)備 方法 程序 | ||
1.一種信息處理設(shè)備,包括:
數(shù)據(jù)獲取器,被配置成獲取具有多個句子的句子集合以及包括在所述句子集合中的多個短語;
短語特征判定器,被配置成判定短語特征,其中每個所述短語特征表示所述數(shù)據(jù)獲取器獲取的所述短語中的各個短語的特性;
集合特征判定器,被配置成判定表示所述句子集合的特性的集合特征;以及
壓縮器,被配置成通過使用所述短語特征和所述集合特征來生成壓縮短語特征,所述壓縮短語特征具有低于所述短語特征的維度的維度以及每個所述壓縮短語特征表示所述數(shù)據(jù)獲取器獲取的所述短語中的各個短語的特性。
2.根據(jù)權(quán)利要求1所述的信息處理設(shè)備,其中,
所述短語特征是具有分量的向量,其中,所述向量的每個分量對應(yīng)于出現(xiàn)在所述多個短語中的詞中的各個詞。
3.根據(jù)權(quán)利要求2所述的信息處理設(shè)備,其中,
所述集合特征是具有分量的矩陣,其中,所述矩陣的每個分量對應(yīng)于出現(xiàn)在所述句子集合中的詞的組合中的各個詞的組合;以及
所述短語特征的向量空間的至少一部分與構(gòu)成所述集合特征的行向量或列向量的向量空間的一部分相重疊。
4.根據(jù)權(quán)利要求3所述的信息處理設(shè)備,其中,
所述壓縮器通過概率模型中的最大似然估計來計算潛在變量,在所述概率模型中,關(guān)于所述多個短語的所述短語特征和所述集合特征被視為觀測數(shù)據(jù),以及所述潛在變量有助于所述觀測數(shù)據(jù)的出現(xiàn);以及
所述壓縮短語特征包括在所述潛在變量中。
5.根據(jù)權(quán)利要求4所述的信息處理設(shè)備,其中,
有助于所述集合特征的出現(xiàn)的潛在變量以及有助于所述短語特征的出現(xiàn)的潛在變量是至少部分地在所述概率模型中彼此通用的變量。
6.根據(jù)權(quán)利要求3所述的信息處理設(shè)備,其中,
所述壓縮器通過所述集合特征的矩陣分解來計算具有低于所述集合特征的階的階的第一低階矩陣,以及通過短語特征矩陣的矩陣分解來計算具有低于所述短語特征矩陣的階的階的第二低階矩陣,其中,所述短語特征矩陣包括關(guān)于所述多個短語的所述短語特征;
所述第二低階矩陣是通過與具有和所述第一低階矩陣的通用部分的矩陣的乘積來近似地導(dǎo)出所述短語特征矩陣的矩陣;以及
所述壓縮短語特征包括在所述第二低階矩陣中。
7.根據(jù)權(quán)利要求3所述的信息處理設(shè)備,其中,
所述集合特征判定器根據(jù)關(guān)于所述詞的所述組合中的每個組合在所述句子集合中共同出現(xiàn)的次數(shù)來判定所述集合特征。
8.根據(jù)權(quán)利要求3所述的信息處理設(shè)備,其中,
所述集合特征判定器根據(jù)詞之間的同義關(guān)系來判定所述集合特征。
9.根據(jù)權(quán)利要求1所述的信息處理設(shè)備,還包括:
聚類部件,被配置成根據(jù)特征之間的相似度來執(zhí)行由所述壓縮器生成的多個壓縮短語特征的聚類。
10.根據(jù)權(quán)利要求9所述的信息處理設(shè)備,其中,
所述聚類部件將與作為所述簇的代表的短語對應(yīng)的標簽給予作為聚類結(jié)果而生成的至少一個簇中的每個簇。
11.根據(jù)權(quán)利要求1所述的信息處理設(shè)備,其中,
所述數(shù)據(jù)獲取器提取均包括在所述句子集合中的一個句子中的詞的對,以及獲取所述多個短語,其中,所述多個短語中的每個短語表示關(guān)于所提取的對中的各個對的所述詞之間的關(guān)系。
12.根據(jù)權(quán)利要求11所述的信息處理設(shè)備,還包括:
聚類部件,被配置成根據(jù)特征之間的相似度來執(zhí)行由所述壓縮器生成的多個壓縮短語特征的聚類;以及
摘要器,被配置成關(guān)注包括在所述句子集合中的特定詞,以及通過使用所述聚類部件關(guān)于與關(guān)注詞有關(guān)的短語的聚類結(jié)果來創(chuàng)建關(guān)于所述關(guān)注詞的摘要信息。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于索尼公司,未經(jīng)索尼公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110096344.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種醫(yī)學影像打印裝置
- 下一篇:一種耐火面料
- 傳感設(shè)備、檢索設(shè)備和中繼設(shè)備
- 簽名設(shè)備、檢驗設(shè)備、驗證設(shè)備、加密設(shè)備及解密設(shè)備
- 色彩調(diào)整設(shè)備、顯示設(shè)備、打印設(shè)備、圖像處理設(shè)備
- 驅(qū)動設(shè)備、定影設(shè)備和成像設(shè)備
- 發(fā)送設(shè)備、中繼設(shè)備和接收設(shè)備
- 定點設(shè)備、接口設(shè)備和顯示設(shè)備
- 傳輸設(shè)備、DP源設(shè)備、接收設(shè)備以及DP接受設(shè)備
- 設(shè)備綁定方法、設(shè)備、終端設(shè)備以及網(wǎng)絡(luò)側(cè)設(shè)備
- 設(shè)備、主設(shè)備及從設(shè)備
- 設(shè)備向設(shè)備轉(zhuǎn)發(fā)





