[發明專利]一種智能解析excel格式國際機票運價單的方法在審
| 申請號: | 201410336305.X | 申請日: | 2014-07-16 |
| 公開(公告)號: | CN104133861A | 公開(公告)日: | 2014-11-05 |
| 發明(設計)人: | 黃翰;葉樹錦;盧爾昂;郝志峰 | 申請(專利權)人: | 華南理工大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 廣州粵高專利商標代理有限公司 44102 | 代理人: | 何淑珍 |
| 地址: | 511400 廣東省廣州市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 智能 解析 excel 格式 國際 機票 運價 方法 | ||
技術領域
本發明一般涉及資訊檢索技術領域,具體涉及一種智能解析excel格式國際機票運價單的方法。
背景技術
隨著生活質量的提高和交通運輸的發展,現在有越來越多的人開始選擇乘坐飛機出行,于是商旅集團將面臨著大量的機票運價單需要處理。傳統的處理方式,是通過人工地閱讀運價單,并將讀到的價單信息手動地錄入系統。然而,不同運價單的格式大相徑庭,就連相同航司的不同價單都存在不少差異。因此通過人工方式進行處理,常常需要耗費許多人力與時間。
基于以上情況,我們提出了一種智能解析excel格式國際機票運價單的方法,代替了人工錄入的方式,從而大量地節省了人力與時間。
發明內容
本發明針對當前手工提取運價單信息技術的不足,提供了一種智能解析并提取excel運價單信息的方法。本發明的目的是通過智能解析運價單,提取運價信息,將價單拆分成多條航程信息,并保存為統一的格式輸出。具體的技術方案如下所述。
一種智能解析excel格式國際機票運價單的方法,包括以下步驟:
(1)對大量已有價單進行分析;
(2)將價單按不同格式進行分類;
(3)對已分類的價單分別進行解析,根據航程屬性所在的大概位置,鎖定檢索范圍;
(4)在鎖定的檢索范圍內,分析歸納所需提取的運價信息的檢索提取規則。
(5)在鎖定的檢索范圍內,進行逐格掃描,查找表格的表頭標志,并記錄表頭的航程屬性以及所在行數;
(6)在表頭位置下一行開始進行逐格掃描,找出所有包含價格信息的單元格,每一個價格信息可以拆分成一條航程;
(7)根據分析歸納的檢索提取規則,找出步驟(6)中所有價格對應的航程屬性,并以統一的格式保存;
(8)重復步驟(5)到(7),直到找不到下一個表頭標志,則對所有表格拆分完畢。
更具體的,步驟(1)中所述的分析為:根據所要提取的運價信息,初步分析不同價單之間的異同。其中所要提取的運價信息包括,出發地、目的地、中轉站、行程類型、最大停留時間、最小停留時間,以及成人運價等航程屬性。
更具體的,步驟(2)中的分類方法為:根據步驟(1)的初步分析,將所需信息存儲方式相近或相同的具有較大共性的價單歸類。
更具體的,步驟(3)的目的在于縮小檢索范圍,提高檢索速度。
更具體的,步驟(4)所述中,分析所需提取的運價信息的檢索提取規則包含以下步驟:
(a)找出所需提取的信息附近是否有共同的固定的關鍵字或關鍵詞組,將其作為檢索標志;
(b)確定所需提取信息與檢索標志之間的位置關系。
更具體的,所述步驟(5)中,表頭通常含有以下航程屬性:
(a)路線,其中包含出發地與中轉站(如有中轉站)的三字碼,并以“-”分隔;
(b)航程類型,包括單程和往返程兩類;
(c)訂座艙位,艙位信息由艙位碼表示,為單個大寫英文字母;
(d)有效期。
更具體的,步驟(6)中價格信息的查找方法為:從表頭位置下一行進行逐格掃描,遇到純數字的單元格,即為存儲價格信息的單元格,記錄價格單元格的總個數。
更具體的,一個價格信息單元對應一條航程,步驟(7)根據步驟(6)中所查找到的價格單元對航程進行拆分?:
(a)利用Java自帶的API找到步驟(4)中所分析歸納的檢索標志;
(b)根據步驟(4)中分析總結的,所需運價信息與檢索標志之間的關系,找出價格信息單元對應的所有運價信息。
(c)對每一個價格信息單元重復步驟(a)和(b),直到將表格按照統一格式拆分成多條航程。
與現有技術相比,本發明具有如下優點和技術效果:本發明通過將excel運價單進行歸類,并分別歸納出檢索提取規則,從而智能解析提取出所需的運價信息,提高檢索速度。?
附圖說明
圖1為本發明所述一種智能解析excel格式國際機票運價單的方法流程示意圖。
具體實施方式
為了讓本領域的技術人員能夠更好地了解本發明的技術方案,下面結合附圖對本發明作進一步的闡述。
如圖1所示,本發明揭示了一種智能解析excel格式國際機票運價單的方法包括以下步驟:
(1)對大量已有價單進行分析:根據所要提取的信息,初步分析不同價單之間的異同。其中所要提取的信息包括,出發地、目的地、中轉站、行程類型、最大停留時間、最小停留時間,以及成人運價等航程屬性。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南理工大學,未經華南理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410336305.X/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種網頁相似度計算方法及裝置
- 下一篇:基于列存儲的智能雙引擎分析系統及方法





