[發(fā)明專利]一種用于地點語義識別的數(shù)據(jù)庫的構(gòu)建方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 201310078531.8 | 申請日: | 2013-03-12 |
| 公開(公告)號: | CN104050173B | 公開(公告)日: | 2020-11-03 |
| 發(fā)明(設(shè)計)人: | 梅懷博 | 申請(專利權(quán))人: | 百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司 |
| 主分類號: | G06F16/29 | 分類號: | G06F16/29;G06F16/21 |
| 代理公司: | 北京鴻德海業(yè)知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11412 | 代理人: | 袁媛 |
| 地址: | 100085 北京*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 用于 地點 語義 識別 數(shù)據(jù)庫 構(gòu)建 方法 系統(tǒng) | ||
本發(fā)明提供了一種用于地點語義識別的數(shù)據(jù)庫的構(gòu)建方法,包括:依據(jù)預(yù)設(shè)樣本區(qū)域的定位歷史日志統(tǒng)計樣本區(qū)域內(nèi)的定位請求量;利用定位請求量和定位歷史日志中的定位請求時間生成樣本區(qū)域的定位請求曲線特征;從樣本區(qū)域的定位請求曲線特征中選出樣本區(qū)域的特征時段,并依據(jù)特征時段或定位請求量獲得樣本區(qū)域的特征指數(shù);利用樣本區(qū)域的特征指數(shù)和定位請求曲線特征構(gòu)建地點語義樣本庫;本發(fā)明還提供一種用于地點語義識別的數(shù)據(jù)庫的構(gòu)建系統(tǒng)。根據(jù)本發(fā)明提供的技術(shù)方案,簡單方便獲取地點語義識別的數(shù)據(jù)源,提高地點語義識別的準(zhǔn)確性。
【技術(shù)領(lǐng)域】
本發(fā)明涉及互聯(lián)網(wǎng)應(yīng)用領(lǐng)域,尤其涉及一種用于地點語義識別的數(shù)據(jù)庫的構(gòu)建方法及系統(tǒng)。
【背景技術(shù)】
目前,城市用地分析、城市規(guī)劃建設(shè)、興趣點(POI,Point of Interest)信息更新、個性化信息推送服務(wù)以及定位服務(wù)等,都需要利用地點語義,地點語義指的是某地點或區(qū)域從社會角度出發(fā)所對應(yīng)的語義類型,例如,陶然亭公園從地理角度出發(fā)所對應(yīng)的描述為北緯xxx度至xxx度,東經(jīng)xxx度至xxx度之間,從社會角度出發(fā)所對應(yīng)的描述為公園,公園就是陶然亭公園的地點語義。
現(xiàn)有技術(shù)中,主要包括以下兩種地點語義識別方法:
第一種方法為以遙感影像為數(shù)據(jù)源,采用地學(xué)相關(guān)分析技術(shù)、分層分析技術(shù)、疊合光譜圖或定量遙感分析技術(shù)等,對圖像進行解析,實現(xiàn)城市中區(qū)域的地點語義識別。其中,中低分辨率的遙感影像難以達到城市建筑物級別的地點語義識別,而高分辨率遙感影像是從城市建筑物的形狀、位置、陰影等特點進行識別,能夠進行城市用地的識別。但是,這種地點語義識別方法受到遙感成像原理所限,遙感影像中像元數(shù)據(jù)所包含的是建筑物在不同電磁波譜的輻射信息和反射率信息,地點語義識別結(jié)果由建筑物的物理特性和化學(xué)特性所決定,因此得到的地點語義識別結(jié)果缺乏與人類活動相關(guān)的信息,因此,利用遙感影像識別地點語義不能實現(xiàn)物理特性相似但用途不同的建筑物的區(qū)分;而且,由于遙感影像是利用衛(wèi)星獲得,因此數(shù)據(jù)源的獲取難度較大,使得地點語義識別的成本較高,時效性較差。
第二種方法為以POI信息為數(shù)據(jù)源,通過對POI進行字面上的語義識別和分類,得到城市中區(qū)域的地點語義。這里,需要經(jīng)過復(fù)雜的語義分析來識別區(qū)域的地點語義,無法體現(xiàn)人類活動規(guī)律,當(dāng)某個區(qū)域的社會用途發(fā)生變化時,地點語義也相應(yīng)發(fā)生變化,人類活動規(guī)律也隨之變化,但是POI信息不能夠及時反映人類活動規(guī)律,會導(dǎo)致地點語義的錯誤識別結(jié)果,而且POI信息需要人工進行數(shù)據(jù)維護和更新,時效性較差,POI信息的采集和更新的人力成本都比較高。
【發(fā)明內(nèi)容】
本發(fā)明提供了一種用于地點語義識別的數(shù)據(jù)庫的構(gòu)建方法及系統(tǒng),簡單方便獲取地點語義識別的數(shù)據(jù)源,提高地點語義識別的準(zhǔn)確性。
本發(fā)明的具體技術(shù)方案如下:
根據(jù)本發(fā)明一優(yōu)選實施例,一種用于地點語義識別的數(shù)據(jù)庫的構(gòu)建方法,包括:
依據(jù)預(yù)設(shè)樣本區(qū)域的定位歷史日志統(tǒng)計樣本區(qū)域內(nèi)的定位請求量;
利用定位請求量和定位歷史日志中的定位請求時間生成樣本區(qū)域的定位請求曲線特征;
從樣本區(qū)域的定位請求曲線特征中選出樣本區(qū)域的特征時段,并依據(jù)特征時段或定位請求量獲得樣本區(qū)域的特征指數(shù);
利用樣本區(qū)域的特征指數(shù)和定位請求曲線特征構(gòu)建地點語義樣本庫。
上述方法中,所述定位請求量為定位請求總量或定位請求用戶量。
上述方法中,所述定位請求曲線特征的時間周期為一天,時間粒度為小時;或,
所述定位請求曲線特征的時間周期為一周,時間粒度為天;或,
所述定位請求曲線特征的時間周期為一個月,時間粒度為天;或,
所述定位請求曲線特征的時間周期為一年,時間粒度為月。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司,未經(jīng)百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310078531.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





