[發明專利]一種數據截取的方法和裝置在審
| 申請號: | 201210192127.9 | 申請日: | 2012-06-11 |
| 公開(公告)號: | CN103488617A | 公開(公告)日: | 2014-01-01 |
| 發明(設計)人: | 何慶明;劉李進 | 申請(專利權)人: | 北京新媒傳信科技有限公司 |
| 主分類號: | G06F17/22 | 分類號: | G06F17/22 |
| 代理公司: | 北京市隆安律師事務所 11323 | 代理人: | 權鮮枝 |
| 地址: | 100089 北京市海淀區萬*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據 截取 方法 裝置 | ||
技術領域
本發明涉及信息處理技術領域,特別涉及一種數據截取的方法和裝置。
背景技術
在數據傳輸和存儲的過程中,由于容量的限制等因素,在很多場景下,都需要對原數據進行截取處理。例如,在傳輸協議中,頭信息一般會固定長度。如果頭信息超過了這個固定長度,就需要對這個頭信息進行截取。現有方案通常采用直接從原數據中截取固定長度數據的方式進行數據截取。
然而,現有的截取方案至少存在如下問題:
當信息中包含了采用統一碼(UNICODE)編碼的字符時,由于一個字符所對應的UNICODE編碼字節個數不確定,則有極大的可能所截取的最后一個字節是代表一個字符的若干字節中的中間的某個字節,從而導致對截取到的數據解碼時最后一個字符的位置出現亂碼,降低了解碼質量和用戶體驗。
發明內容
本發明提供的一種數據截取的方法和裝置,以解決現有數據截取方案導致解碼后最后一個字符為亂碼,解碼質量和用戶體驗較低的問題。
為達到上述目的,本發明實施例采用了如下技術方案:
本發明實施例提供的一種數據截取的方法包括:
將需要截取的字符串轉換為預定編碼格式;
判斷轉換后的字符串的長度是否大于截取長度,若否,提取所有轉換后的字符串作為截取到的數據;若是,執行如下處理:
將截取長度所對應的字節作為截取點字節,并根據所述預定編碼格式,判斷所述截取點字節是否位于后一個字符的開頭字節之前;
若是,從字符串的起始字節至所述截取點字節對轉換后的字符串進行截取,作為截取到的數據;若否,利用所述截取點字節的前一字節更新截取點字節,直至判斷出截取點字節位于后一個字符的開頭字節之前。
本發明實施例提供的一種數據截取的裝置包括:
格式轉換單元,用于將需要截取的字符串轉換為預定編碼格式;
長度判斷單元,用于判斷轉換后的字符串的長度是否大于截取長度;
第一截取單元,用于在長度判斷單元判斷出轉換后的字符串的長度不大于截取長度時,提取所有轉換后的字符串作為截取到的數據;
第二截取單元,用于在長度判斷單元判斷出轉換后的字符串的長度大于截取長度時,將截取長度所對應的字節作為截取點字節,并根據所述預定編碼格式,判斷所述截取點字節是否位于后一個字符的開頭字節之前,若是,從字符串的起始字節至所述截取點字節對轉換后的字符串進行截取,作為截取到的數據;若否,利用所述截取點字節的前一字節更新截取點字節,直至判斷出截取點字節位于后一個字符的開頭字節之前。
本發明實施例的有益效果是:
本發明實施例通過在預定編碼格式下,判斷截取點字節是否位于后一字符的開頭字節之前,并在截取長度內從位于后一字符開頭字節之前的截取點字節執行數據的截取,確保了截取點不會出現在一個字符的多個字節的中間,能夠達到對截取的數據解碼后不會出現亂碼,提高解碼質量和用戶體驗的技術效果。
附圖說明
圖1為本發明實施例一提供的一種數據截取的方法流程圖;
圖2為本發明實施例二提供的判斷截取點字節位置的方法流程圖;
圖3為本發明實施例三提供的一種數據截取的裝置結構示意圖。
具體實施方式
為使本發明的目的、技術方案和優點更加清楚,下面將結合附圖對本發明實施方式作進一步地詳細描述。
本發明的技術構思主要在于每個字符都有對應的一個UNICODE表示,根據UNICODE編碼和預定編碼(如UTF-8編碼)的對應關系,可以找出一個UNICODE字符的開頭,如找出一個漢字的開頭,該字符的開頭之前,就是前面字符的結尾。這樣的話,在截取時,通過只截取到前面字符結尾部分,即當前字符開頭的前面,就不會出現截取到字符的中間字節導致對截取數據無法正常解碼的問題,從而對字符的截取更精確,解碼質量和用戶體驗更好。
本發明實施例一提供的一種數據截取的方法,參見圖1,包括:
11:將需要截取的字符串轉換為預定編碼格式。
12:判斷轉換后的字符串的長度是否大于截取長度,若否,執行步驟13,若是,執行步驟14。
13:提取所有轉換后的字符串作為截取到的數據,截取操作結束。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京新媒傳信科技有限公司,未經北京新媒傳信科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210192127.9/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





