[發明專利]一種面向OGC地理信息服務數據的挖掘分析與推薦方法在審
| 申請號: | 201711183946.6 | 申請日: | 2017-11-23 |
| 公開(公告)號: | CN108121760A | 公開(公告)日: | 2018-06-05 |
| 發明(設計)人: | 苗立志;李小杰;徐興永;徐韜;婁沖;刁繼堯;崔進東 | 申請(專利權)人: | 南京郵電大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 江蘇愛信律師事務所 32241 | 代理人: | 唐小紅 |
| 地址: | 210023 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 挖掘 地理信息服務 個性化推薦 關聯規則 采集 領域本體庫 語義 地理信息 地質礦產 分類標準 關聯關系 結果反饋 聚類算法 數據變化 數據結構 數據清洗 數據挖掘 數據選擇 推薦系統 用戶需要 分析 地質 參考 決策 | ||
本發明公開了一種面向OGC地理信息服務數據挖掘分析及推薦方法,屬于地理信息語義挖掘技術領域。該方法在不破壞數據結構的情況下對數據進行挖掘,為決策提供具有指導意義的理論依據,同時基于得到的關聯規則對用戶進行個性化推薦。步驟1:利用HttpClient技術對數據進行采集。步驟2:利用DOM4J和TF?IDF技術對數據進行關鍵詞的提取。步驟3:參考地質礦產術語分類標準GB/T9649.32?2009和OGC WMS規范建立地質領域本體庫。步驟4:對采集到的數據進行數據清洗、數據選擇、數據變化。步驟5:通過聚類算法對處理過的數據進行關聯關系挖掘。步驟6:設計一個推薦系統,對用戶需要的資源進行結果反饋并基于關聯規則對用戶進行個性化推薦。
技術領域
本發明涉及一種面向OGC地理信息服務數據挖掘分析及推薦方法,屬于地理信息語義挖掘技術領域。
背景技術
地理信息服務GIS(Geographic Information Services),就是對地理信息提供的服務,它包括地理數據服務和地理信息系統信息處理功能的服務。地理信息服務有著數據源廣、發布形式多以及應用多元化的特點,導致地理信息數據表達形式的多樣化。為了實現地理信息資源的充分共享和廣泛使用,OGC(Open Geospatial Consortium,開放地理空間聯合會)面向地理信息數據的集成與互操作相關研究分別提出了WMS(Web Map Service,網絡地圖服務)、WFS(Web Feature Service,網絡要素服務)、WCS(Web Coverage Service,網絡柵格服務)、CSW(Catalog Service for the Web,網絡目錄服務)和SOS(SensorObservation Service,傳感器觀測服務)等多個OWS(OGC Web Service,OGC網絡服務)實現規范。數據擁有者基于OGC的多種地理信息數據相關的網絡服務實現規范,可以進行網絡在線發布供用戶使用,極大促進了地理信息數據的共享。
隨著OGC地理信息服務應用領域和受眾群體的日益廣泛,人們對OGC地理信息服務的需求也越來越多元,從事地理信息產業的政府部門、企業機構等紛紛將地理數據以服務的形式在網絡上注冊和發布,使得地理信息服務的數量急劇增長。在這些OGC服務系統中含有大量的屬性數據,有著比一般關系數據庫和事務數據庫更加豐富和復雜的語義信息,隱藏著豐富的知識。雖然現在的OGC服務系統在功能上可以滿足一些低層次的需求,如進行數據的收集、查詢和簡單的統計,但是人們無法從這些大量的屬性數據中挖掘出對決策具有指導意義的知識。對數據進行搜集以及更高層次的分析,為決策提供具有指導意義的理論依據,是目前人們追求的目標。而如何對數據進行分析,為決策提供具有指導意義的理論依據,是急需解決的問題。
發明內容
鑒于地理信息語義挖掘領域存在的上述不足,本發明基于OGC服務標準,對OGC地理信息服務元數據(能力描述文件)進行關聯規則挖掘,在不破壞OWS能力文檔原有機構的基礎上對海量OWS進行關聯規則挖掘,并基于挖掘的關聯規則對用戶進行個性化推薦。
為了達到上述目的,本發明采用如下的技術方案:
步驟1:利用HttpClient技術對數據進行采集。
步驟2:利用DOM4J和TF-IDF對數據進行關鍵詞的提取。
步驟3:建立地質領域本體庫。
步驟4:對采集到的數據進行數據清洗、數據選擇、數據變化。
步驟5:通過聚類算法對數據進行關聯關系挖掘。
步驟6:基于所挖掘的關聯規則進行推薦。
進一步地,本發明上述步驟4中包括如下子步驟:
步驟4-1:在數據清洗和選擇階段,去除不一致和無效的數據,對服務名稱、服務標題、服務摘要、服務關鍵字這四個標簽值進行關鍵詞匯提取,把所提取到的關鍵字存儲到數據庫。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京郵電大學,未經南京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711183946.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:電子設備及其控制方法
- 下一篇:一種網頁頁面加載方法及裝置





