[發(fā)明專利]編碼方法和編碼裝置在審
| 申請(qǐng)?zhí)枺?/td> | 201810240597.5 | 申請(qǐng)日: | 2018-03-22 |
| 公開(kāi)(公告)號(hào): | CN108694159A | 公開(kāi)(公告)日: | 2018-10-23 |
| 發(fā)明(設(shè)計(jì))人: | 片岡正弘;袴田隼毅 | 申請(qǐng)(專利權(quán))人: | 富士通株式會(huì)社 |
| 主分類(lèi)號(hào): | G06F17/22 | 分類(lèi)號(hào): | G06F17/22;G06F17/27 |
| 代理公司: | 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 唐京橋;劉雯鑫 |
| 地址: | 日本神*** | 國(guó)省代碼: | 日本;JP |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 編碼裝置 動(dòng)態(tài)詞典 動(dòng)態(tài)代碼 文本數(shù)據(jù) 編碼單元 單詞編碼 單詞登記 屬性信息 單詞 關(guān)聯(lián) 配置 | ||
本發(fā)明涉及編碼方法和編碼裝置。根據(jù)本發(fā)明的編碼裝置包括編碼單元,被配置成:獲取文本數(shù)據(jù);基于文本數(shù)據(jù)中所包括的第一單詞的屬性信息來(lái)指定多個(gè)動(dòng)態(tài)詞典中的第一動(dòng)態(tài)詞典;將與第一動(dòng)態(tài)代碼相關(guān)聯(lián)的第一單詞登記在第一動(dòng)態(tài)詞典中;以及將第一單詞編碼為第一動(dòng)態(tài)代碼。
技術(shù)領(lǐng)域
本文所討論的實(shí)施方式涉及編碼技術(shù)。
背景技術(shù)
近年來(lái),在進(jìn)行數(shù)據(jù)的編碼時(shí),存在以單詞為單位進(jìn)行編碼的技術(shù)。在以單詞為單位的編碼中,跨多個(gè)單詞的編碼沒(méi)有以與基于ZIP的壓縮不同的方式執(zhí)行。通過(guò)以單詞為單位進(jìn)行編碼,編碼數(shù)據(jù)的一部分可以在保持編碼的同時(shí)被提取并被重新使用。
這里,在以單詞為單位進(jìn)行編碼的情況下,通過(guò)使用靜態(tài)詞典和動(dòng)態(tài)詞典來(lái)進(jìn)行編碼。靜態(tài)詞典是其中代碼與具有高出現(xiàn)頻率的單詞相關(guān)聯(lián)的信息。如果作為編碼目標(biāo)的單詞不存在于靜態(tài)詞典中,則通過(guò)將這個(gè)單詞登記在動(dòng)態(tài)詞典中并為該單詞分配動(dòng)態(tài)代碼來(lái)進(jìn)行編碼。例如,根據(jù)單詞出現(xiàn)的順序來(lái)分配動(dòng)態(tài)代碼。
例如,在日本特許公開(kāi)專利公報(bào)第2013-150041號(hào)、第09-214352號(hào)和第11-284517號(hào)中公開(kāi)了相關(guān)技術(shù)。
發(fā)明內(nèi)容
技術(shù)問(wèn)題
然而,上述相關(guān)技術(shù)涉及難以有效使用動(dòng)態(tài)詞典的問(wèn)題。
當(dāng)使用動(dòng)態(tài)詞典時(shí)分配給單詞的動(dòng)態(tài)代碼是根據(jù)單詞的出現(xiàn)順序分配的。此外,當(dāng)編碼目標(biāo)從文本擴(kuò)展到可擴(kuò)展標(biāo)記語(yǔ)言(XML)數(shù)據(jù)等時(shí),除了具有低出現(xiàn)頻率的單詞和未知單詞以外,多種和大量的數(shù)字串和字符串(例如數(shù)值、標(biāo)簽和路徑列表)也被登記在動(dòng)態(tài)詞典中作為單詞。為此,當(dāng)編碼數(shù)據(jù)的一部分被提取并重新使用時(shí),整個(gè)動(dòng)態(tài)詞典被掃描并且確定各自的類(lèi)型。如果動(dòng)態(tài)詞典的大小很大,則處理時(shí)間變長(zhǎng)并且動(dòng)態(tài)詞典不能被有效地使用。
在一個(gè)方面中,本文討論的實(shí)施方式旨在提供允許有效使用動(dòng)態(tài)詞典的編碼程序、方法和裝置。
問(wèn)題的解決方案
根據(jù)實(shí)施方式的一個(gè)方面,編碼裝置包括編碼單元,其被配置成:獲取文本數(shù)據(jù);基于文本數(shù)據(jù)中所包括的第一單詞的屬性信息來(lái)指定多個(gè)動(dòng)態(tài)詞典中的第一動(dòng)態(tài)詞典;將與第一動(dòng)態(tài)代碼相關(guān)聯(lián)第一單詞登記在第一動(dòng)態(tài)詞典中;以及將第一單詞編碼為第一動(dòng)態(tài)代碼。
本發(fā)明的有益效果
動(dòng)態(tài)詞典能夠被有效地使用。
附圖說(shuō)明
圖1是示出了根據(jù)實(shí)施方式1的信息處理裝置的編碼處理的一個(gè)示例的圖;
圖2是示出了根據(jù)實(shí)施方式1的信息處理裝置的配置的功能框圖;
圖3是示出了根據(jù)實(shí)施方式1的編碼單元的配置的一個(gè)示例的功能框圖;
圖4是示出了靜態(tài)詞典信息的數(shù)據(jù)結(jié)構(gòu)的一個(gè)示例的圖;
圖5是示出了動(dòng)態(tài)詞典信息的數(shù)據(jù)結(jié)構(gòu)的一個(gè)示例的圖;
圖6是示出了類(lèi)型表的數(shù)據(jù)結(jié)構(gòu)的一個(gè)示例的圖;
圖7是示出了根據(jù)實(shí)施方式1的解壓縮單元的配置的一個(gè)示例的功能框圖;
圖8是示出了根據(jù)實(shí)施方式1的編碼單元的處理過(guò)程的一個(gè)示例的流程圖;
圖9是示出了根據(jù)實(shí)施方式1的解壓縮單元的處理過(guò)程的流程圖;
圖10是示出了根據(jù)實(shí)施方式2的信息處理裝置的編碼處理的一個(gè)示例的圖;
圖11是示出了根據(jù)實(shí)施方式2的信息處理裝置的配置的功能框圖;
圖12是示出了根據(jù)實(shí)施方式2的編碼單元的配置的一個(gè)示例的功能框圖;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于富士通株式會(huì)社,未經(jīng)富士通株式會(huì)社許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810240597.5/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類(lèi)專利
- 專利分類(lèi)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 提供解碼器到編碼器的反饋以改進(jìn)幀刪除情況下預(yù)測(cè)語(yǔ)言編碼裝置性能的方法和裝置
- 編碼裝置、使用它的攝像機(jī)裝置及編碼方法
- 動(dòng)畫(huà)編碼設(shè)備、動(dòng)畫(huà)編碼方法和動(dòng)畫(huà)編碼程序
- 音頻編碼和解碼
- 編碼裝置、使用它的攝像機(jī)裝置及編碼方法
- 用于幀內(nèi)預(yù)測(cè)視頻編碼的模式選擇技術(shù)
- 使用聯(lián)合計(jì)算功率對(duì)多個(gè)信息信號(hào)進(jìn)行編碼
- 編碼裝置、解碼裝置、編解碼系統(tǒng)、編碼方法以及解碼方法
- 點(diǎn)陣編碼處理系統(tǒng)
- 一種編解碼的方法和裝置
- 一種跨屏運(yùn)行應(yīng)用的方法及系統(tǒng)
- 動(dòng)態(tài)語(yǔ)言代碼執(zhí)行方法和裝置
- 動(dòng)態(tài)語(yǔ)言的優(yōu)化執(zhí)行
- 一種惡意代碼樣本自動(dòng)處理的方法及裝置
- 動(dòng)態(tài)UI業(yè)務(wù)端代碼性能檢測(cè)方法及裝置
- 一種代碼安全掃描方法及系統(tǒng)
- 一種代碼處理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 應(yīng)用程序運(yùn)行控制方法、裝置、設(shè)備和介質(zhì)
- 代碼處理方法、污點(diǎn)分析方法和裝置
- 一種信息的風(fēng)險(xiǎn)防控方法、裝置及設(shè)備
- 一種韻律預(yù)測(cè)方法及系統(tǒng)
- 一種基于KNN技術(shù)的語(yǔ)料庫(kù)文本分類(lèi)方法
- 文本數(shù)據(jù)標(biāo)注方法及裝置、存儲(chǔ)介質(zhì)、電子設(shè)備
- 數(shù)據(jù)采集方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本的處理、文本分類(lèi)模型的訓(xùn)練方法及裝置
- 文本加密方法及裝置、終端設(shè)備、存儲(chǔ)介質(zhì)
- 文本數(shù)據(jù)處理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 富文本數(shù)據(jù)處理方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 文本分類(lèi)模型構(gòu)建、文本分類(lèi)方法及裝置
- 文本匹配方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





