[發(fā)明專利]興趣點(diǎn)POI分類方法和裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201810711963.0 | 申請(qǐng)日: | 2018-06-29 |
| 公開(kāi)(公告)號(hào): | CN109033219B | 公開(kāi)(公告)日: | 2022-03-11 |
| 發(fā)明(設(shè)計(jì))人: | 楊建東;唐旺;張紹瑞 | 申請(qǐng)(專利權(quán))人: | 北京奇虎科技有限公司 |
| 主分類號(hào): | G06F16/29 | 分類號(hào): | G06F16/29;G06F16/9537;G06F16/906 |
| 代理公司: | 北京恒博知識(shí)產(chǎn)權(quán)代理有限公司 11528 | 代理人: | 范勝祥 |
| 地址: | 100088 北京市西城區(qū)新*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 興趣 poi 分類 方法 裝置 | ||
本發(fā)明公開(kāi)了興趣點(diǎn)POI分類方法和裝置。所述方法包括:根據(jù)樣本POI訓(xùn)練POI名稱到POI類別的分類模型;根據(jù)所述分類模型和目標(biāo)POI的POI名稱,確定所述目標(biāo)POI的一個(gè)或多個(gè)POI調(diào)整類別;根據(jù)所述一個(gè)或多個(gè)POI調(diào)整類別對(duì)所述目標(biāo)POI的POI類別進(jìn)行調(diào)整。該技術(shù)方案通過(guò)機(jī)器學(xué)習(xí),利用大量可靠樣本POI訓(xùn)練得到的模型對(duì)待調(diào)整POI進(jìn)行類別調(diào)整,使得POI分類準(zhǔn)確度提升,并進(jìn)一步可以應(yīng)用于搜索場(chǎng)景提升POI查詢的準(zhǔn)確度。
技術(shù)領(lǐng)域
本發(fā)明涉及電子地圖技術(shù)領(lǐng)域,具體涉及興趣點(diǎn)POI分類方法和裝置。
背景技術(shù)
POI通常是point of interest(興趣點(diǎn))的縮寫,也可以指point of information(信息點(diǎn))。興趣點(diǎn)和信息點(diǎn)在地圖中可以作為出銀行、景點(diǎn)、公司、醫(yī)院、政府機(jī)構(gòu)、餐館、商場(chǎng)等的標(biāo)識(shí)。本發(fā)明中的“興趣點(diǎn)”和“POI”均指上述含義。
POI可以包含很多信息,例如省、市、區(qū)、地址、經(jīng)緯度、名稱、類型等。目前,許多查詢需要按照POI類別來(lái)檢索POI,而許多POI的類別(type)字段由于數(shù)據(jù)來(lái)源等原因,存在臟數(shù)據(jù),造成查詢結(jié)果并不準(zhǔn)確,不符合需求。
發(fā)明內(nèi)容
鑒于上述問(wèn)題,提出了本發(fā)明以便提供一種克服上述問(wèn)題或者至少部分地解決上述問(wèn)題的興趣點(diǎn)POI分類方法和裝置。
依據(jù)本發(fā)明的一個(gè)方面,提供了一種興趣點(diǎn)POI分類方法,包括:根據(jù)樣本POI訓(xùn)練POI名稱到POI類別的分類模型;根據(jù)所述分類模型和目標(biāo)POI的POI名稱,確定所述目標(biāo)POI的一個(gè)或多個(gè)POI調(diào)整類別;根據(jù)所述一個(gè)或多個(gè)POI調(diào)整類別對(duì)所述目標(biāo)POI的POI類別進(jìn)行調(diào)整。
可選地,所述樣本POI是從預(yù)設(shè)的一個(gè)或多個(gè)數(shù)據(jù)來(lái)源獲取的,所述數(shù)據(jù)來(lái)源的POI類別可信度不小于第一閾值。
可選地,所述訓(xùn)練POI名稱到POI類別的分類模型包括:對(duì)樣本POI的POI名稱進(jìn)行分詞處理,根據(jù)分詞結(jié)果,選取POI名稱尾部的一個(gè)或多個(gè)詞,根據(jù)選取的詞生成特征進(jìn)行分類模型訓(xùn)練。
可選地,所述選取POI名稱尾部的一個(gè)或多個(gè)詞,根據(jù)選取的詞生成特征進(jìn)行分類模型訓(xùn)練包括:從POI名稱尾部開(kāi)始進(jìn)行N次選取,分別選取1個(gè)詞、2個(gè)詞……N個(gè)詞,將選取的詞的組合作為特征進(jìn)行分類模型訓(xùn)練;其中,N為正整數(shù)。
可選地,所述根據(jù)所述分類模型和目標(biāo)POI的POI名稱,確定所述目標(biāo)POI的一個(gè)或多個(gè)POI調(diào)整類別包括:按照貝葉斯分類方法得到所述目標(biāo)POI的M個(gè)POI訓(xùn)練類別和各POI類別對(duì)應(yīng)的概率;其中,M為正整數(shù);從所述M個(gè)POI訓(xùn)練類別中,按所述概率由高至低取出k個(gè)POI訓(xùn)練類別作為確定的一個(gè)或多個(gè)POI調(diào)整類別;其中,k為不大于M的正整數(shù)。
可選地,所述根據(jù)所述一個(gè)或多個(gè)POI調(diào)整類別對(duì)所述目標(biāo)POI的POI類別進(jìn)行調(diào)整包括:確定所述目標(biāo)POI的原POI類別與各POI調(diào)整類別的兼容度;若原POI類別中的一個(gè)POI類別與各POI調(diào)整類別的兼容度均小于第二閾值,則從原POI類別中清除該P(yáng)OI類別;若清除完畢后的原POI類別不為空,則將原POI類別中剩余的全部POI類別作為調(diào)整后的POI類別;若清除完畢后的原POI類別為空,則將該k個(gè)POI調(diào)整類別作為調(diào)整后的POI類別。
可選地,該方法還包括:將確定的一個(gè)或多個(gè)POI調(diào)整類別中,所述概率低于第三閾值的POI調(diào)整類別記為POI備選類別;在確定所述目標(biāo)POI的原POI類別與各POI調(diào)整類別的兼容度時(shí),不需確定原POI類別與POI備選類別的兼容度。
可選地,該方法還包括:根據(jù)所述樣本POI的POI類別,預(yù)先計(jì)算并保存各POI類別的兼容度。
可選地,所述預(yù)先計(jì)算并保存各POI類別的兼容度包括:對(duì)兩個(gè)類別a和b,基于公式P=#(a,b)/min(#a,#b)計(jì)算兼容度;其中,P為兼容度,#為統(tǒng)計(jì)得到的樣本POI中POI類別的出現(xiàn)次數(shù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京奇虎科技有限公司,未經(jīng)北京奇虎科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810711963.0/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 興趣點(diǎn)系統(tǒng)、興趣點(diǎn)信息系統(tǒng)以及下載多個(gè)興趣點(diǎn)的方法
- 用戶興趣點(diǎn)的確定方法、裝置及終端
- 一種全局興趣探索推薦方法和裝置
- 信息中心聯(lián)網(wǎng)中的跟蹤排隊(duì)延遲和執(zhí)行相關(guān)的擁塞控制的方法、裝置及介質(zhì)
- 興趣點(diǎn)重要度測(cè)量方法和裝置
- 一種導(dǎo)航方法及系統(tǒng)
- 興趣偏好預(yù)測(cè)方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種興趣點(diǎn)的質(zhì)量評(píng)分獲取方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 聚合興趣點(diǎn)的方法、裝置、設(shè)備和介質(zhì)
- 用于優(yōu)化興趣點(diǎn)標(biāo)簽的方法和裝置
- POI數(shù)據(jù)處理方法及其裝置、POI檢索方法及其裝置
- 一種生成POI數(shù)據(jù)的方法及裝置
- 用于把興趣點(diǎn)(POI)添加到POI列表中的導(dǎo)航設(shè)備
- 一種興趣點(diǎn)顯示信息的設(shè)置方法及裝置
- POI數(shù)據(jù)的處理方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 興趣點(diǎn)POI分類方法和裝置
- 一種基于用戶生成內(nèi)容的POI空間影響力評(píng)價(jià)方法及系統(tǒng)
- 一種POI判重方法、裝置、移動(dòng)終端及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- POI檢索熱度確定方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 模型的訓(xùn)練方法、POI標(biāo)簽檢測(cè)方法和裝置
- 一種數(shù)據(jù)庫(kù)讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





