[發明專利]一種基于深度知識表達的聚類分析系統及方法有效
| 申請號: | 201811454392.3 | 申請日: | 2018-11-30 |
| 公開(公告)號: | CN109508749B | 公開(公告)日: | 2023-07-25 |
| 發明(設計)人: | 陳超;劉強;謝雪楓 | 申請(專利權)人: | 重慶大學 |
| 主分類號: | G06F18/23213 | 分類號: | G06F18/23213 |
| 代理公司: | 西安利澤明知識產權代理有限公司 61222 | 代理人: | 劉偉 |
| 地址: | 400044 重慶市沙坪壩*** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 知識 表達 聚類分析 系統 方法 | ||
本發明提供了一種基于深度知識表達出租車乘客出行目的的聚類分析系統,用于自動推測出租車乘客出行目的。首先,從兩個眾包數據集中提取三種與出行目的相關的三種語境,實現出租車乘客出行語境的增強;其次,設計了一個棧式自編碼器,在隱層語義空間中實現深度知識表達;最后,基于棧式自動編碼器中的隱層空間,使用K?means數據聚類算法獲得所有出租車乘客出行的集群,根據原始數據空間中的出行語境解譯每個集群的出行目的,并可根據實際的應用概要分析不同出行目的的時間演變趨勢。
技術領域
本發明涉及出租車乘客出行數據挖掘,涉及聚類分析領域,特別是涉及自動推測出租車乘客出行目的的系統。
背景技術
出行行為分析是一項包括計算機科學和社會科學等許多領域在內的重要研究課題。傳統上,這項研究是根據問卷式調查、電腦輔助電話調查、電腦輔助自我填報方法調查收集到的數據進行的。顯然,這類方法存在若干的限制,如調查費用高、受訪者負擔重、時空覆蓋面小等。更糟糕的是,隨著城市的快速發展,出行行為分析比以往更加的復雜,這給出行行為分析帶來了很大的挑戰。然而,由于近幾年來GPS設備的流行和普及,大量有時間戳的個體定位數據被很容易地記錄下來,這讓時空數據以補充或取代傳統收集的數據成為一個熱門趨勢,也讓出行行為分析的研究得到持續的發展。目前,GPS軌跡數據雖然豐富但缺乏必要的語義信息,如出租車乘客出行結束后所執行的活動信息,即出租車乘客出行目的。這種活動信息涉及隱私問題,因此無法直接收集。在城市計算中出租車乘客出行目的是重要的組成部分,這受到學術界相對較少的關注。
出租車乘客出行目的的推測是一個長期的研究,以往的研究大多數將其作為數據挖掘中的分類任務,這對于出租車GPS軌跡數據可能會存在問題。更具體地說,分類是一種監督學習方法,它需要知道訓練數據中每個樣本的分類準確性。在現實中,一方面,這種大規模訓練集標記正確的數據通常是難以獲得的;另一方面,在現階段,訓練數據往往是根據乘客的回憶被標記為正確,而乘客可能會忘記他們究竟具體做了什么。此外,由于乘客下車后的軌跡是未知的,出租車乘客出行的目的地通常不是乘客最終活動的地點。
發明內容
為了克服上述的問題,本發明從一個不同的角度出發,以具有相似的出租車乘客出行目的在時空上應具有一定的相似性為動機,將該任務作為聚類任務。本發明提供了一種基于深度知識表達出租車乘客出行目的的聚類分析系統,用于自動推測出租車乘客出行目的。首先,從兩個眾包數據集中提取三種與出行目的相關的三種語境,實現出租車乘客出行語境的增強;其次,設計了一個棧式自編碼器,在隱層語義空間中實現深度知識表達;最后,基于棧式自動編碼器中的隱層空間,使用K-means數據聚類算法獲得所有出租車乘客出行的集群,根據原始數據空間中的出行語境解譯每個集群的出行目的,并可根據實際的應用概要分析不同出行目的的時間演變趨勢。
具體而言,本發明提供了一種基于深度知識表達的聚類分析系統的方案為:
一種基于深度知識表達出租車乘客出行目的的聚類分析系統,其特征是:包括出租車乘客出行語境增強模塊、深度知識表達模塊與聚類、解譯和概要分析出租車乘客出行目的模塊。
所述的出租車乘客出行語境增強模塊,是基于出租車乘客出行數據和Foursquare簽到數據,提取出特定時間段的POI附近的配置和人類流行的活動,以增強出行起始地和目的地的語境。
所述的深度知識表達模塊,是基于出租車乘客出行數據,建立一個棧式自編碼器,利用編碼器得到數據空間和隱層空間的初始映射,然后在隱層空間中獲得對應的隱層表示。
所述的聚類、解譯和概要分析出租車乘客出行目的模塊,是采用K-means數據聚類算法聚合相似的隱層表示,然后根據聚類結果解譯出行目的,并概要分析城市范圍內出行目的的時間演變趨勢。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶大學,未經重慶大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811454392.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種聚類方法及裝置
- 下一篇:用戶起訖點聚類分析方法、裝置及存儲介質





