[發(fā)明專利]一種用于描述關(guān)系數(shù)據(jù)的增強(qiáng)型CSV文件格式無效
| 申請(qǐng)?zhí)枺?/td> | 201010105986.0 | 申請(qǐng)日: | 2010-02-04 |
| 公開(公告)號(hào): | CN101789013A | 公開(公告)日: | 2010-07-28 |
| 發(fā)明(設(shè)計(jì))人: | 王興山;趙啟杰 | 申請(qǐng)(專利權(quán))人: | 浪潮集團(tuán)山東通用軟件有限公司 |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 250014 山*** | 國省代碼: | 山東;37 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 用于 描述 關(guān)系 數(shù)據(jù) 增強(qiáng) csv 文件格式 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及的是信息系統(tǒng)數(shù)據(jù)交換過程中的一種人機(jī)可讀的高效的字符串編碼方法和文件格式,具體地說是一種用于描述關(guān)系數(shù)據(jù)的增強(qiáng)型CSV文件格式。
背景技術(shù)
當(dāng)代軟件開發(fā)技術(shù)日新月異,數(shù)據(jù)訪問技術(shù)林立,不同的系統(tǒng)之間進(jìn)行關(guān)系型數(shù)據(jù)交換是一種極為常見的應(yīng)用。
XML是信息交換的一種標(biāo)準(zhǔn),但是它作為一種通用標(biāo)記語言,如果要描述關(guān)系型數(shù)據(jù)需要進(jìn)行深度擴(kuò)展,結(jié)構(gòu)較為復(fù)雜,而且冗余字符較多,不夠精簡(jiǎn)。因此,開發(fā)人員常采用CSV文件格式。
逗號(hào)分隔型取值格式(英文全稱為Comma?Separated?Values,簡(jiǎn)稱CSV),是一種純文本格式,用來存儲(chǔ)數(shù)據(jù)。在CSV中,數(shù)據(jù)的字段由逗號(hào)分開,程序通過讀取文件重新創(chuàng)建正確的字段,方法是每次遇到逗號(hào)時(shí)開始新一段數(shù)據(jù)。由于它是一種常見而簡(jiǎn)單的文件格式,CSV文件通常用于不同的計(jì)算機(jī)軟件或同一軟件不同的模塊間進(jìn)行數(shù)據(jù)傳遞交換。很多數(shù)據(jù)庫程序和電子表格程序都支持CSV文件格式。
CSV文件用來做數(shù)據(jù)存儲(chǔ)容量比XML小,功能比TXT強(qiáng),但是CSV文件仍不具備完整描述關(guān)系型數(shù)據(jù)的能力,它不包含關(guān)系型數(shù)據(jù)中的數(shù)據(jù)域信息,僅僅保存了數(shù)據(jù)域的名稱信息,這樣就難以精確從CSV文件中反序列化成一個(gè)關(guān)系型記錄集。
發(fā)明內(nèi)容
關(guān)系型數(shù)據(jù)的序列化包括二進(jìn)制和字符串兩種,二進(jìn)制序列化不便于信息交換。字符串序列化則便于數(shù)據(jù)交換。常見的字符串序列化技術(shù)有XML、CSV等。XML序列化較為復(fù)雜,而CSV格式則較為簡(jiǎn)單。但是CSV序列化是一種“有損”序列化。
本發(fā)明的目的是提供一種改進(jìn)型的CSV文件,克服CSV文件格式的弱點(diǎn),精確描述一個(gè)關(guān)系型記錄集,為計(jì)算機(jī)軟件之間進(jìn)行表格數(shù)據(jù)傳遞提供一個(gè)統(tǒng)一的、簡(jiǎn)單的標(biāo)準(zhǔn)的用于描述關(guān)系數(shù)據(jù)的增強(qiáng)型CSV文件格式。
本發(fā)明的目的是按以下方式實(shí)現(xiàn)的,采用CSV的基本標(biāo)記方式,根據(jù)元數(shù)據(jù)的自描述能力,把一個(gè)關(guān)系型記錄集完整的進(jìn)行序列化,文件格式把記錄集的一行序列化為一個(gè)不包含回車換行符號(hào)的字符序列,具體步驟如下:
文件格式包含兩個(gè)部分:1)元數(shù)據(jù)段;2)數(shù)據(jù)段;其中:
1)元數(shù)據(jù)段定義字段信息,元數(shù)據(jù)部分每行都是一個(gè)簡(jiǎn)短的CSV文件,其中字段定義,根據(jù)具體情況存在多行,字段定義采用如下語法:
<字段名稱=數(shù)據(jù)類型>,<字段長度>,<顯示標(biāo)簽>,<編輯掩碼>,<顯示長度>,<字段類型>,<缺省值>,字段長度規(guī)則:字符串型字段的長度為最大字符數(shù);數(shù)值型和二進(jìn)制型字段長度統(tǒng)一為零;
數(shù)據(jù)類型包括:Autoinc,Integer,F(xiàn)loat,String,WideString,DateTime,Blob,Memo,Currency,Boolean;
2)數(shù)據(jù)段包含兩部分:字段排列順序信息行、數(shù)據(jù)行,其中字段排列順序信息行以逗號(hào)分隔各標(biāo)題,每個(gè)字段名放在兩個(gè)引號(hào)中間,格式為:
″<Field1Caption>″,[″<Field2Caption>″],[……]
數(shù)據(jù)行列出對(duì)應(yīng)的字段值,字段值放在雙引號(hào)之間,字段值之間用逗號(hào)分隔:格式為:
″<Field1Value>″,″<Field2Value>″,<……>,數(shù)據(jù)行中的編碼規(guī)則是:
(1)″轉(zhuǎn)為″″(兩個(gè)引號(hào)表示一個(gè)引號(hào));
(2)%轉(zhuǎn)為%%(兩個(gè)%表示一個(gè));
(3)回車用%c表示;
(4)換行用%n表示;
(5)Unicode用UTF-8編碼;
(6)二進(jìn)制數(shù)據(jù)用MIME編碼;
(7)時(shí)間類型用MM/DD/YYYY/HH/mm/SS/sss格式表示。
本發(fā)明的優(yōu)異效果是:與現(xiàn)有技術(shù)相比,本發(fā)明采用上述編碼格式的文件具有人機(jī)可讀性,避免歧義,可以被支持CSV格式的程序解析,解碼算法簡(jiǎn)單,便于數(shù)據(jù)流讀取,可廣泛應(yīng)用于各類系統(tǒng)進(jìn)行表格數(shù)據(jù)交換。
附圖說明
圖1是關(guān)系型數(shù)據(jù)轉(zhuǎn)增強(qiáng)型CSV文件算法流程圖;
圖2是一份完整的增強(qiáng)型CSV文件。
具體實(shí)施方式
本發(fā)明的一種用于描述關(guān)系數(shù)據(jù)的增強(qiáng)型CSV文件格式,含兩個(gè)部分:1)元數(shù)據(jù)段2)數(shù)據(jù)段。
1)元數(shù)據(jù)段定義字段信息。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浪潮集團(tuán)山東通用軟件有限公司,未經(jīng)浪潮集團(tuán)山東通用軟件有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010105986.0/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 關(guān)系視圖
- 位置關(guān)系檢測(cè)裝置以及位置關(guān)系檢測(cè)系統(tǒng)
- 關(guān)系建模
- 關(guān)系分析方法、關(guān)系分析程序、以及關(guān)系分析裝置
- 實(shí)體關(guān)系分類裝置和實(shí)體關(guān)系分類方法
- 用戶關(guān)系抽取方法和用戶關(guān)系抽取系統(tǒng)
- 融合依存關(guān)系與篇章修辭關(guān)系的事件時(shí)序關(guān)系識(shí)別方法
- 開關(guān)系統(tǒng)
- 視頻視覺關(guān)系檢測(cè)的關(guān)系片段連接方法
- 開關(guān)系統(tǒng)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





