[發明專利]基于特征和語義的景點信息匹配方法及裝置在審
| 申請號: | 201710240811.2 | 申請日: | 2017-04-13 |
| 公開(公告)號: | CN108733665A | 公開(公告)日: | 2018-11-02 |
| 發明(設計)人: | 江浩 | 申請(專利權)人: | 藝龍網信息技術(北京)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27 |
| 代理公司: | 北京律智知識產權代理有限公司 11438 | 代理人: | 王輝;闞梓瑄 |
| 地址: | 100015 北京市朝*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 匹配 匹配對象 景點信息 語義 景點 基礎特征 計算機可讀存儲介質 匹配準確率 電子設備 景點位置 匹配結果 匹配效率 匹配裝置 預設 | ||
本公開涉及一種基于特征和語義的景點信息匹配方法、基于特征和語義的景點信息匹配裝置、計算機可讀存儲介質以及電子設備。所述的景點信息匹配方法包括:判斷一待匹配景點位置的預設范圍內是否存在基礎特征與所述待匹配景點相匹配的可匹配對象;在判斷存在基礎特征與所述待匹配景點相匹配的可匹配對象時,判斷所述待匹配景點名稱與所述可匹配對象名稱是否匹配;結合所述待匹配景點名稱與所述可匹配對象名稱的匹配結果,判斷所述待匹配景點與所述可匹配對象是否匹配。本公開能有效降低人工匹配的成本,并提升匹配準確率和匹配效率。
技術領域
本公開涉及數據處理技術領域,具體涉及一種基于特征和語義的景點信息匹配方法、基于特征和語義的景點信息匹配裝置、計算機可讀存儲介質以及電子設備。
背景技術
現有旅游網站上的旅游景點、酒店、飯店等產品通常都會接入多個渠道的產品來源,但是不同來源的同一產品的基礎數據信息經常會有所差別。以旅游景點產品為例,各個供應商對接的景點和門票資源數據每天都會有新景點上線和資源售完等產品狀態變化。由于實際的景點數量的變化并不頻繁,所以各個供應商的景點數據會有大量重復,需要把不同供應商的同一景點信息識別出來,進行產品數據的匹配和整合。實際情況中同一景點各個供應商提供的基礎數據基本都不一致或部分信息缺失,包括名稱,地址等都有差別,給自動化大量數據情況下的景點的匹配工作帶來了困難。
例如,同一景點北京故宮在供應商A叫“故宮”,供應商B叫“故宮博物院”,供應商C叫“北京故宮”;另一景點嘉興南湖風景區在供應商A叫“南湖景區”,供應商B叫“南湖風景名勝區”且雙方地址描述也不相同。目前全部景點數據平均在2.1w,每天都有數據變化需要重新匹配,全部靠人力分析每人1天最多匹配200個景點,每次需要20人/天左右的工作量且需要定期重復,成本很高。
需要說明的是,在上述背景技術部分公開的信息僅用于加強對本公開的背景的理解,因此可以包括不構成對本領域普通技術人員已知的現有技術的信息。
發明內容
本公開的目的在于提供一種基于特征和語義的景點信息匹配方法、基于特征和語義的景點信息匹配裝置、計算機可讀存儲介質以及電子設備,進而至少在一定程度上克服由于相關技術的限制和缺陷而導致的一個或者多個問題。
本公開的其他特性和優點將通過下面的詳細描述變得顯然,或部分地通過本公開的實踐而習得。
根據本公開的第一方面,提供一種基于特征和語義的景點信息匹配方法,包括:
判斷一待匹配景點位置的預設范圍內是否存在基礎特征與所述待匹配景點相匹配的可匹配對象;
在判斷存在基礎特征與所述待匹配景點相匹配的可匹配對象時,判斷所述待匹配景點名稱與所述可匹配對象名稱是否匹配;
結合所述待匹配景點名稱與所述可匹配對象名稱的匹配結果,判斷所述待匹配景點與所述可匹配對象是否匹配。
在本公開的一種示例性實施例中,所述結合所述待匹配景點名稱與所述可匹配對象名稱的匹配結果包括:
在判斷所述待匹配景點名稱與所述可匹配對象名稱相匹配時,判斷所述待匹配景點位置與所述可匹配對象位置的距離差是否小于第一閾值;
在判斷所述距離差小于所述第一閾值時,判定所述待匹配景點與所述可匹配對象匹配成功。
在本公開的一種示例性實施例中,所述判斷一待匹配景點位置的預設范圍內是否存在基礎特征與所述待匹配景點相匹配的可匹配對象包括:
獲取待匹配景點列表中的一所述待匹配景點;
檢測數據庫中是否存在位于所述待匹配景點的預設范圍內的所述可匹配對象,并將存在的所述可匹配對象生成一對象列表;
檢測所述對象列表中的可匹配對象與所述待匹配景點的基礎特征是否匹配。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于藝龍網信息技術(北京)有限公司,未經藝龍網信息技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710240811.2/2.html,轉載請聲明來源鉆瓜專利網。





