[發(fā)明專利]數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及記錄介質(zhì)有效
| 申請?zhí)枺?/td> | 201810695673.1 | 申請日: | 2018-06-29 |
| 公開(公告)號: | CN110209665B | 公開(公告)日: | 2023-07-28 |
| 發(fā)明(設(shè)計)人: | 近藤真暉 | 申請(專利權(quán))人: | 株式會社東芝;東芝數(shù)字解決方案株式會社 |
| 主分類號: | G06F16/22 | 分類號: | G06F16/22;G06F16/583;G06F18/23213 |
| 代理公司: | 永新專利商標(biāo)代理有限公司 72002 | 代理人: | 楊謙 |
| 地址: | 日本*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 數(shù)據(jù)處理 裝置 方法 以及 記錄 介質(zhì) | ||
本發(fā)明涉及數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及記錄介質(zhì)。能夠高效地對特征矢量進(jìn)行量化。數(shù)據(jù)處理裝置具備子矢量群生成部、碼本生成部以及轉(zhuǎn)換部。子矢量群生成部從由N個D維特征矢量構(gòu)成的特征矢量集合生成M個(M<D)的子矢量群。M個子矢量群分別包括從N個D維特征矢量的每一個中獲得的N個維可變子矢量。N個維可變子矢量分別將從D維特征矢量提取的1以上的維的值作為元素。至少一個子矢量群中的維可變子矢量的元素的數(shù)量與其他子矢量群中的維可變子矢量的元素的數(shù)量不同。碼本生成部對N個維可變子矢量進(jìn)行聚類,生成將各簇的代表矢量與索引建立起對應(yīng)的碼本。轉(zhuǎn)換部通過直積量化,將D維特征矢量轉(zhuǎn)換為由M個索引的組合構(gòu)成的壓縮碼。
本申請享受2018年2月15日在先提出的日本專利申請?zhí)?018-024700的優(yōu)先權(quán)的利益,并且引入其全部內(nèi)容。
技術(shù)領(lǐng)域
本發(fā)明的實(shí)施方式涉及數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及記錄介質(zhì)。
背景技術(shù)
伴隨著大數(shù)據(jù)時代的到來,大量保留例如在圖案識別等中被用作示例的特征矢量的必要性增加。伴隨于此,用于保留特征矢量的存儲器、硬盤驅(qū)動器等硬件成本增大。作為該問題的解決對策之一,已知有通過直積量化來減少特征矢量的存儲大小(memory?size)的方法。直積量化是如下技術(shù):將特征矢量分割成多個子矢量,參照碼本,將各子矢量置換為簇的代表矢量的索引,從而將特征矢量轉(zhuǎn)換為壓縮碼。碼本是通過將應(yīng)保留的特征矢量集合按照每個子矢量進(jìn)行聚類并將各簇的代表矢量與索引建立對應(yīng)而生成的查找表。
在將特征矢量分割為多個子矢量時,以往,一般是以使各個子矢量的維數(shù)相同的方式均等地分割特征矢量。但是,在該方法中,在不同的子矢量間,分散的程度產(chǎn)生較大的不均,有時在生成碼本時由于子矢量而導(dǎo)致簇數(shù)過剩或過小。而且,若使用這樣生成的碼本進(jìn)行特征矢量的直積量化,則擔(dān)心量化效率降低。
發(fā)明內(nèi)容
本發(fā)明要解決的課題是要提供一種能夠高效地對特征矢量進(jìn)行量化的數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及記錄介質(zhì)。
實(shí)施方式的數(shù)據(jù)處理裝置具備子矢量群生成部、碼本生成部以及轉(zhuǎn)換部。子矢量群生成部從由N個D維特征矢量構(gòu)成的特征矢量集合生成M個(其中,M<D)子矢量群。上述M個子矢量群分別包括從上述N個D維特征矢量的每一個獲得的N個維可變子矢量。上述N個維可變子矢量分別將從上述D維特征矢量提取的1以上的維的值作為元素。上述M個子矢量群中的至少一個子矢量群中的上述維可變子矢量的元素的數(shù)量與其他子矢量群中的上述維可變子矢量的元素的數(shù)量不同。碼本生成部按照上述M個子矢量群的每一個,對上述N個維可變子矢量進(jìn)行聚類,生成將各簇的代表矢量與索引建立起對應(yīng)的碼本。轉(zhuǎn)換部通過使用了上述碼本的直積量化,將上述N個D維特征矢量分別轉(zhuǎn)換為由M個索引的組合構(gòu)成的壓縮碼。
通過上述構(gòu)成的數(shù)據(jù)處理裝置,能夠高效地對特征矢量進(jìn)行量化。
附圖說明
圖1是表示特征矢量集合的一例的圖。
圖2是說明從特征矢量集合生成子矢量群的現(xiàn)有方法的圖。
圖3是說明生成碼本的現(xiàn)有方法的圖。
圖4是說明參照碼本將特征矢量轉(zhuǎn)換為壓縮碼的方法的圖。
圖5是說明參照碼本將特征矢量轉(zhuǎn)換為壓縮碼的方法的圖。
圖6是表示第一實(shí)施例的數(shù)據(jù)處理裝置的功能的構(gòu)成例的框圖。
圖7是表示從特征矢量集合生成子矢量群的情形的圖。
圖8是表示子矢量群生成部進(jìn)行的處理的具體例的流程圖。
圖9是表示生成碼本的情形的圖。
圖10是表示第二實(shí)施例的數(shù)據(jù)處理裝置的功能的構(gòu)成例的框圖。
圖11是說明簇數(shù)上限值的探索方法的圖。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于株式會社東芝;東芝數(shù)字解決方案株式會社,未經(jīng)株式會社東芝;東芝數(shù)字解決方案株式會社許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810695673.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)處理設(shè)備,數(shù)據(jù)處理方法,和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理電路、數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法、數(shù)據(jù)處理控制方法
- 數(shù)據(jù)處理設(shè)備、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及計算機(jī)可讀取的記錄介質(zhì)
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 接收裝置以及接收方法、以及程序
- 凈水濾芯以及凈水裝置、以及洗漱臺
- 隱匿檢索系統(tǒng)以及公開參數(shù)生成裝置以及加密裝置以及用戶秘密密鑰生成裝置以及查詢發(fā)布裝置以及檢索裝置以及計算機(jī)程序以及隱匿檢索方法以及公開參數(shù)生成方法以及加密方法以及用戶秘密密鑰生成方法以及查詢發(fā)布方法以及檢索方法
- 編碼方法以及裝置、解碼方法以及裝置
- 編碼方法以及裝置、解碼方法以及裝置
- 圖片顯示方法以及裝置以及移動終端
- ENB以及UEUL發(fā)送以及接收的方法
- X射線探測方法以及裝置以及系統(tǒng)
- 圖書信息錄入方法以及系統(tǒng)以及書架
- 護(hù)耳器以及口罩以及眼鏡





