[發明專利]一種用于地點語義識別的數據庫的構建方法及系統有效
| 申請號: | 201310078531.8 | 申請日: | 2013-03-12 |
| 公開(公告)號: | CN104050173B | 公開(公告)日: | 2020-11-03 |
| 發明(設計)人: | 梅懷博 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G06F16/29 | 分類號: | G06F16/29;G06F16/21 |
| 代理公司: | 北京鴻德海業知識產權代理事務所(普通合伙) 11412 | 代理人: | 袁媛 |
| 地址: | 100085 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 地點 語義 識別 數據庫 構建 方法 系統 | ||
1.一種用于地點語義識別的數據庫的構建方法,其特征在于,該方法包括:
依據預設樣本區域的定位歷史日志統計樣本區域內的定位請求量;
利用定位請求量和定位歷史日志中的定位請求時間生成樣本區域的定位請求曲線特征;
從樣本區域的定位請求曲線特征中選出樣本區域的特征時段,并依據特征時段或定位請求量獲得樣本區域的特征指數;
利用樣本區域的特征指數和定位請求曲線特征構建地點語義樣本庫;
依據預設目標區域的定位歷史日志和構建的地點語義樣本庫,獲得目標區域與地點語義樣本庫中每個樣本區域的曲線特征匹配系數和特征指數匹配系數;
將曲線特征匹配系數和特征指數匹配系數的乘積最高的樣本區域的地點語義作為所述目標區域的地點語義。
2.根據權利要求1所述的方法,其特征在于,所述定位請求量為定位請求總量或定位請求用戶量。
3.根據權利要求1所述的方法,其特征在于,
所述定位請求曲線特征的時間周期為一天,時間粒度為小時;或,
所述定位請求曲線特征的時間周期為一周,時間粒度為天;或,
所述定位請求曲線特征的時間周期為一個月,時間粒度為天;或,
所述定位請求曲線特征的時間周期為一年,時間粒度為月。
4.根據權利要求1所述的方法,其特征在于,所述樣本區域的特征時段為:樣本區域與其他樣本區域的定位請求曲線特征的斜率差值超過預設的曲線斜率閾值的時段;或,樣本區域的定位請求曲線特征中曲線斜率超過曲線斜率最大值或小于曲線斜率最小值的時段;或,樣本區域的定位請求曲線特征中定位請求量超過定位請求量閾值的時段。
5.根據權利要求1所述的方法,其特征在于,所述依據特征時段獲得樣本區域的特征指數具體包括:
計算特征時段在定位請求曲線特征中的曲線斜率,將所述曲線斜率作為樣本區域的特征指數;或,
計算兩個特征時段的定位請求量的比值,將所述比值作為樣本區域的特征指數。
6.根據權利要求1所述的方法,其特征在于,利用如下公式獲得樣本區域的特征指數:
其中,a表示特征指數,T表示特征區間,Q(D1|T)和Q(D2|T)分別表示特征區間T在不同時間的定位請求量。
7.根據權利要求1所述的方法,其特征在于,獲得目標區域與地點語義樣本庫中樣本區域的曲線特征匹配系數的方法為:
利用目標區域的定位歷史日志生成目標區域的定位請求曲線特征y=f(t);
利用公式y'=f(t)/Max(f(t))對目標區域的定位請求曲線特征進行歸一化處理,得到歸一化曲線特征y',其中Max(f(t))為f(t)的最大值;
對地點語義樣本庫中的定位請求曲線特征進行歸一化處理,得到歸一化曲線特征Y'i,利用公式Δyi=y'-Y'i(i=1,2,……,N)得到y'與Y'i的歸一化差分;
計算Δyi的期望值Ei和方差Di,利用公式ai=(1-|Ei|)(1-|Di|)得到曲線特征匹配系數ai。
8.根據權利要求1所述的方法,其特征在于,獲得目標區域與地點語義樣本庫中樣本區域的特征指數匹配系數的方法為:
選出目標區域的定位請求曲線特征的特征時段,得到每個特征時段的特征指數;
依據地點語義樣本庫得到每個樣本區域的特征時段,提取其中具有相同特征時段的一組以上樣本區域,每組樣本區域包括兩個以上樣本區域;
獲得目標區域在每組樣本區域的相同特征時段的特征指數;
獲得目標區域與每組樣本區域中每個樣本區域的特征指數的相似度,將相似度作為目標區域與樣本區域的特征指數匹配系數bi。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310078531.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:移動終端的應用信息處理方法和裝置
- 下一篇:片上系統及其操作方法





