[發(fā)明專利]一種基于LDA模型的地鐵站點(diǎn)功能挖掘方法有效
| 申請(qǐng)?zhí)枺?/td> | 201710817833.0 | 申請(qǐng)日: | 2017-09-13 |
| 公開(公告)號(hào): | CN107656987B | 公開(公告)日: | 2020-07-14 |
| 發(fā)明(設(shè)計(jì))人: | 孔祥杰;夏鋒;付振寰;郭昊塵;王進(jìn)忠 | 申請(qǐng)(專利權(quán))人: | 大連理工大學(xué) |
| 主分類號(hào): | G06F16/2458 | 分類號(hào): | G06F16/2458;G06Q50/26;G06K9/62 |
| 代理公司: | 大連理工大學(xué)專利中心 21200 | 代理人: | 溫福雪;侯明遠(yuǎn) |
| 地址: | 116024 遼*** | 國省代碼: | 遼寧;21 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 lda 模型 地鐵 站點(diǎn) 功能 挖掘 方法 | ||
本發(fā)明屬于數(shù)據(jù)挖掘技術(shù)領(lǐng)域,一種基于LDA模型的地鐵站點(diǎn)功能挖掘方法,步驟如下:1)數(shù)據(jù)收集:包括地鐵刷卡數(shù)據(jù)、地鐵POI數(shù)據(jù)等。經(jīng)過篩選提取預(yù)處理以后,得到實(shí)驗(yàn)所需的潛在主題分布向量,以保證分析結(jié)果的普適性;2)語義挖掘:應(yīng)用LDA主題模型,以乘客出行模式分布矩陣和POI相對(duì)含量矩陣為輸入挖掘動(dòng)靜語義;3)站點(diǎn)聚類:在功能挖掘方面,本發(fā)明使用先進(jìn)的聚類算法獲得按功能的站點(diǎn)聚類簇;4)站點(diǎn)分類標(biāo)識(shí):本發(fā)明從類間客流轉(zhuǎn)移、地理功能占比分布、簇間相似度3個(gè)角度提出站點(diǎn)功能標(biāo)識(shí)方法,使得分析結(jié)果權(quán)威可靠。以上海地鐵為例進(jìn)行的地鐵站點(diǎn)功能挖掘?qū)嶒?yàn)表明,本方法對(duì)于處理類似問題具有出色表現(xiàn)。
技術(shù)領(lǐng)域
本發(fā)明屬于數(shù)據(jù)挖掘技術(shù)領(lǐng)域,尤其在揭示地鐵沿線區(qū)域功能、把握城市交通系統(tǒng)規(guī)劃、建設(shè)智慧城市等領(lǐng)域具有重要意義,具體涉及一種基于LDA模型的地鐵站點(diǎn)功能挖掘方法。
背景技術(shù)
隨著信息技術(shù)革命的不斷深入,信息化與數(shù)字化的浪潮席卷了現(xiàn)代城市。然而,現(xiàn)代化和城市化的迅猛發(fā)展也帶來了諸如交通擁堵、資源配置、環(huán)境污染等棘手問題。如今,大數(shù)據(jù)的發(fā)展為解決這些問題提供了思路和可能。利用城市大數(shù)據(jù)和城市計(jì)算為城市管理者和規(guī)劃者提供有價(jià)值的信息參考,提升城市管理、服務(wù)效率,可以處理城市發(fā)展中遇到的問題和挑戰(zhàn)?;A(chǔ)設(shè)施方面,傳感技術(shù)的大范圍擴(kuò)散、智能交通系統(tǒng)以及基于地理位置的IT服務(wù)不但為城市生活帶來了智能和極大的便捷,還使我們獲得了大量的城市數(shù)據(jù),例如人類移動(dòng)軌跡信息、社會(huì)活動(dòng)信息及環(huán)境信息等,同時(shí),數(shù)據(jù)中心和云計(jì)算的建設(shè)和發(fā)展也在技術(shù)上使我們具備了處理這些大規(guī)模異構(gòu)數(shù)據(jù)的能力。
數(shù)據(jù)挖掘是一門結(jié)合了統(tǒng)計(jì)學(xué)、人工智能、機(jī)器學(xué)習(xí)和數(shù)據(jù)庫系統(tǒng)的發(fā)現(xiàn)巨大的數(shù)據(jù)集中模式的計(jì)算過程,是計(jì)算機(jī)科學(xué)下的一門交叉學(xué)科。數(shù)據(jù)挖掘的總目標(biāo)是從數(shù)據(jù)集中提取信息并將其轉(zhuǎn)化為可理解的結(jié)構(gòu)為未來所用。
在現(xiàn)代城市交通系統(tǒng)中,地鐵憑借載客量大、快速高效、低環(huán)境污染的特點(diǎn)成為當(dāng)今都市最優(yōu)的交通方式。作為一座城市交通的脈搏,一方面,地鐵系統(tǒng)方便了城市中心地帶間的互通往來,因此,地鐵站點(diǎn)往往是一座城市執(zhí)行其城市功能最中心的地標(biāo)性地帶,另一方面,地鐵也促進(jìn)了地鐵線路沿線經(jīng)過的區(qū)域的發(fā)展,故而新的功能區(qū)在地鐵站點(diǎn)處聚集成型。眾所周知,城市的不同區(qū)域在城市發(fā)展的進(jìn)程中漸漸孕育出了各類的城市功能,以滿足居民某種特定的社會(huì)經(jīng)濟(jì)活動(dòng)需求,這些區(qū)域既可以是人為的被規(guī)劃者所設(shè)計(jì),也可能是由于人類實(shí)際生活方式所自然形成,同時(shí),在一個(gè)城市發(fā)展的過程中,這些功能區(qū)的區(qū)域和功能都可以被改變。在地鐵沿線的站點(diǎn)所在區(qū)域的功能形成和演化正是以上過程的典型代表,加以地鐵系統(tǒng)在城市發(fā)展中不可或缺的地位,使得地鐵沿線地區(qū)的功能相較其他區(qū)域更為特殊重要。
發(fā)明內(nèi)容
本發(fā)明的目的是運(yùn)用數(shù)據(jù)挖掘的方法揭示地鐵沿線區(qū)域功能。挖掘地鐵站點(diǎn)這一城市重要的特殊區(qū)域的功能,可以讓我們了解城市核心功能分布,把握城市生命線發(fā)展脈絡(luò),進(jìn)而為諸如城市交通系統(tǒng)規(guī)劃、區(qū)域發(fā)展規(guī)劃、資源配置等城市規(guī)劃提供寶貴的參考,建設(shè)智慧城市,具有重要的實(shí)際意義。
本發(fā)明的技術(shù)方案:
一種基于LDA模型的地鐵站點(diǎn)功能挖掘方法,步驟如下:
(1)收集地鐵客流數(shù)據(jù)作為乘客出行模式矩陣,收集地鐵POI數(shù)據(jù)作為POI相對(duì)含量矩陣;
(2)以乘客出行模式矩陣和POI相對(duì)含量矩陣為輸入,應(yīng)用LDA主題模型挖掘站點(diǎn)靜動(dòng)語義;
(3)移動(dòng)語義挖掘與位置語義挖掘
a)將所有站點(diǎn)的出行模式的頻率通過一個(gè)形為m*n的矩陣Msp來表示,其中m為站點(diǎn)的總數(shù)目,n為所有可能出現(xiàn)的出行模式的總數(shù)目;
b)將站點(diǎn)出行模式矩陣Msp作為LDA的輸入,得到一個(gè)m*k的站點(diǎn)功能矩陣,其中,k為潛在功能的數(shù)目,k設(shè)為20;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于大連理工大學(xué),未經(jīng)大連理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710817833.0/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 光掃描裝置以及圖像形成裝置
- 基于LDA主題模型的中醫(yī)藥數(shù)據(jù)挖掘方法
- 一種用于LDA的外腔鎖模波長合束裝置和方法
- 高功率板條激光放大器
- 一種基于潛在狄利克雷分配(LDA)模型的關(guān)鍵詞推薦方法和系統(tǒng)
- 一種基于K-means和LDA雙向驗(yàn)證的網(wǎng)絡(luò)行為習(xí)慣聚類方法
- 一種基于word2vec?LDA模型的文本主題詞提取方法
- 一種基于平行語料庫的跨語種新聞主題相似性對(duì)比方法
- 信息推薦方法及裝置
- 興趣點(diǎn)數(shù)據(jù)獲取方法、裝置、可讀存儲(chǔ)介質(zhì)和計(jì)算機(jī)設(shè)備
- 一種地鐵窗外投影器及地鐵投影系統(tǒng)
- 自帶牽引組合式地鐵車輛
- 一種智能地鐵安全感應(yīng)系統(tǒng)
- 一種智能地鐵安全感應(yīng)系統(tǒng)
- 用于深度學(xué)習(xí)地鐵軌道識(shí)別的訓(xùn)練數(shù)據(jù)集標(biāo)注的生成方法
- 地鐵乘客下車時(shí)間識(shí)別方法、系統(tǒng)、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種與城際鐵路站房免安檢、一票制換乘的地鐵車站
- 地鐵機(jī)構(gòu)碼獲取方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種上下地鐵秩序引導(dǎo)裝置
- 一種地鐵車門關(guān)門時(shí)的輔助防夾人設(shè)備





