[發(fā)明專利]編碼方法和編碼裝置在審
| 申請?zhí)枺?/td> | 201810240597.5 | 申請日: | 2018-03-22 |
| 公開(公告)號: | CN108694159A | 公開(公告)日: | 2018-10-23 |
| 發(fā)明(設(shè)計)人: | 片岡正弘;袴田隼毅 | 申請(專利權(quán))人: | 富士通株式會社 |
| 主分類號: | G06F17/22 | 分類號: | G06F17/22;G06F17/27 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 唐京橋;劉雯鑫 |
| 地址: | 日本神*** | 國省代碼: | 日本;JP |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 編碼裝置 動態(tài)詞典 動態(tài)代碼 文本數(shù)據(jù) 編碼單元 單詞編碼 單詞登記 屬性信息 單詞 關(guān)聯(lián) 配置 | ||
1.一種編碼裝置,包括:
編碼單元,被配置成:
獲取文本數(shù)據(jù);
基于所述文本數(shù)據(jù)中所包括的第一單詞的屬性信息來指定多個動態(tài)詞典中的第一動態(tài)詞典;
將與第一動態(tài)代碼相關(guān)聯(lián)的所述第一單詞登記在所述第一動態(tài)詞典中;以及
將所述第一單詞編碼為所述第一動態(tài)代碼。
2.根據(jù)權(quán)利要求1所述的編碼裝置,所述編碼單元還被配置成:
確定所述文本數(shù)據(jù)中所包括的第二單詞是否被包括在靜態(tài)詞典中;以及
當所述第二單詞被包括在所述靜態(tài)詞典中時,將所述第二單詞編碼為與所述靜態(tài)詞典中的所述第二單詞相關(guān)聯(lián)的第一靜態(tài)代碼。
3.根據(jù)權(quán)利要求2所述的編碼裝置,其中,所述第一單詞未被包括在所述靜態(tài)詞典中。
4.根據(jù)權(quán)利要求1所述的編碼裝置,所述編碼單元還被配置成:
基于所述文本數(shù)據(jù)中所包括的第三單詞的屬性信息來指定所述多個動態(tài)詞典中的第二動態(tài)詞典;
確定所述第三單詞是否被包括在所述第二動態(tài)詞典中;以及
當所述第三單詞被包括在所述第二動態(tài)詞典中時,將所述第三單詞編碼為與所述第二動態(tài)詞典中的所述第三單詞相關(guān)聯(lián)的第二動態(tài)代碼。
5.根據(jù)權(quán)利要求1所述的編碼裝置,其中,所述屬性信息是指示單詞的類型的信息。
6.根據(jù)權(quán)利要求1所述的編碼裝置,其中,所述屬性信息是所述文本數(shù)據(jù)中所包括的所述第一單詞的位置信息。
7.根據(jù)權(quán)利要求6所述的編碼裝置,其中,所述文本數(shù)據(jù)是具有分層結(jié)構(gòu)的文檔,并且所述位置信息指示所述分層結(jié)構(gòu)中的位置。
8.根據(jù)權(quán)利要求6所述的編碼裝置,其中,所述文本數(shù)據(jù)通過分隔符被分割成多個列,并且所述位置信息指示在所述多個列中所述第一單詞所在的列。
9.一種由計算機執(zhí)行的編碼方法,所述編碼方法包括:
獲取文本數(shù)據(jù);
基于所述文本數(shù)據(jù)中所包括的第一單詞的屬性信息來指定多個動態(tài)詞典中的第一動態(tài)詞典;
將與第一動態(tài)代碼相關(guān)聯(lián)的所述第一單詞登記在所述第一動態(tài)詞典中;以及
將所述第一單詞編碼為所述第一動態(tài)代碼。
10.一種存儲編碼程序的非暫態(tài)計算機可讀介質(zhì),所述編碼程序使計算機執(zhí)行下述處理,所述處理包括:
獲取文本數(shù)據(jù);
基于所述文本數(shù)據(jù)中所包括的第一單詞的屬性信息來指定多個動態(tài)詞典中的第一動態(tài)詞典;
將與第一動態(tài)代碼相關(guān)聯(lián)的所述第一單詞登記在所述第一動態(tài)詞典中;以及
將所述第一單詞編碼為所述第一動態(tài)代碼。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于富士通株式會社,未經(jīng)富士通株式會社許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810240597.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種韻律預(yù)測方法及系統(tǒng)
- 一種基于KNN技術(shù)的語料庫文本分類方法
- 文本數(shù)據(jù)標注方法及裝置、存儲介質(zhì)、電子設(shè)備
- 數(shù)據(jù)采集方法、裝置、設(shè)備及計算機可讀存儲介質(zhì)
- 文本的處理、文本分類模型的訓(xùn)練方法及裝置
- 文本加密方法及裝置、終端設(shè)備、存儲介質(zhì)
- 文本數(shù)據(jù)處理方法、裝置、電子設(shè)備及存儲介質(zhì)
- 富文本數(shù)據(jù)處理方法、裝置、計算機設(shè)備及存儲介質(zhì)
- 文本分類模型構(gòu)建、文本分類方法及裝置
- 文本匹配方法、裝置、設(shè)備及存儲介質(zhì)





