[發(fā)明專利]酒店識別處理方法、裝置、設備及存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202010084428.4 | 申請日: | 2020-02-10 |
| 公開(公告)號: | CN111325638A | 公開(公告)日: | 2020-06-23 |
| 發(fā)明(設計)人: | 賀夏龍;康文云 | 申請(專利權(quán))人: | 北京螞蜂窩網(wǎng)絡科技有限公司 |
| 主分類號: | G06Q50/12 | 分類號: | G06Q50/12;G06F16/35;G06F16/55 |
| 代理公司: | 北京同立鈞成知識產(chǎn)權(quán)代理有限公司 11205 | 代理人: | 張寧;劉芳 |
| 地址: | 100015 北京市朝陽*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 酒店 識別 處理 方法 裝置 設備 存儲 介質(zhì) | ||
1.一種酒店識別處理方法,其特征在于,該方法包括:
獲取至少兩條酒店數(shù)據(jù);
根據(jù)所述至少兩條酒店數(shù)據(jù),確定所述至少兩條酒店數(shù)據(jù)中的每一條酒店數(shù)據(jù)對應的文本特征和圖像特征;
根據(jù)所述每一條酒店數(shù)據(jù)對應的文本特征和圖像特征,確定所述至少兩條酒店數(shù)據(jù)中的任意兩條酒店數(shù)據(jù)對應的文本特征的第一相似度和圖像特征的第二相似度;
根據(jù)所述第一相似度和所述第二相似度,判斷所述任意兩條酒店數(shù)據(jù)是否對應同一酒店,并將對應同一酒店的所述酒店數(shù)據(jù)合并后顯示。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述酒店數(shù)據(jù)包括文本數(shù)據(jù)和圖像數(shù)據(jù),所述根據(jù)所述至少兩條酒店數(shù)據(jù),確定所述至少兩條酒店數(shù)據(jù)中的每一條酒店數(shù)據(jù)對應的文本特征和圖像特征,包括:
根據(jù)所述至少兩條酒店數(shù)據(jù),獲取所述至少兩條酒店數(shù)據(jù)中的每一條酒店數(shù)據(jù)中的文本數(shù)據(jù)和圖像數(shù)據(jù);
對所述每一條酒店數(shù)據(jù)中的文本數(shù)據(jù)和圖像數(shù)據(jù)進行特征提取,得到所述至少兩條酒店數(shù)據(jù)中的每一條酒店數(shù)據(jù)對應的文本特征和圖像特征。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述文本數(shù)據(jù)包括名稱數(shù)據(jù)、地址數(shù)據(jù)和經(jīng)緯度數(shù)據(jù),所述文本特征包括名稱特征、類型特征和地址特征,對所述每一條酒店數(shù)據(jù)中的文本數(shù)據(jù)進行特征提取,得到所述至少兩條酒店數(shù)據(jù)中的每一條酒店數(shù)據(jù)對應的文本特征,包括:
根據(jù)所述每一條酒店數(shù)據(jù)中的文本數(shù)據(jù),獲取所述每一條酒店數(shù)據(jù)中的文本數(shù)據(jù)中的名稱數(shù)據(jù)、地址數(shù)據(jù)和經(jīng)緯度數(shù)據(jù);
對所述名稱數(shù)據(jù)進行第一分詞處理,得到第一地址特征;根據(jù)所述地址數(shù)據(jù),確定第二地址特征;根據(jù)所述經(jīng)緯度數(shù)據(jù),確定第三地址特征;對所述第一地址特征、第二地址特征和第三地址特征進行特征合并,得到所述至少兩條酒店數(shù)據(jù)中的每一條酒店數(shù)據(jù)對應的地址特征;
對所述名稱數(shù)據(jù)進行第二分詞處理,得到所述至少兩條酒店數(shù)據(jù)中的每一條酒店數(shù)據(jù)對應的類型特征;
對所述名稱數(shù)據(jù)進行第三分詞處理,得到所述至少兩條酒店數(shù)據(jù)中的每一條酒店數(shù)據(jù)對應的名稱特征。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,根據(jù)所述每一條酒店數(shù)據(jù)對應的文本特征,確定所述至少兩條酒店數(shù)據(jù)中的任意兩條酒店數(shù)據(jù)對應的文本特征的第一相似度,包括:
根據(jù)所述每一條酒店數(shù)據(jù)對應的地址特征,確定所述至少兩條酒店數(shù)據(jù)中的任意兩條酒店數(shù)據(jù)對應的地址特征的第三相似度;
根據(jù)所述每一條酒店數(shù)據(jù)對應的類型特征,確定所述至少兩條酒店數(shù)據(jù)中的任意兩條酒店數(shù)據(jù)對應的類型特征的第四相似度;
根據(jù)所述每一條酒店數(shù)據(jù)對應的名稱特征,確定所述至少兩條酒店數(shù)據(jù)中的任意兩條酒店數(shù)據(jù)對應的名稱特征的第五相似度;
按照第一預設規(guī)則對所述第三相似度、第四相似度和第五相似度進行加權(quán)處理,得到所述至少兩條酒店數(shù)據(jù)中的任意兩條酒店數(shù)據(jù)對應的文本特征的第一相似度。
5.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述圖像數(shù)據(jù)包括圖像內(nèi)容數(shù)據(jù)和圖像質(zhì)量數(shù)據(jù),所述圖像特征包括圖像內(nèi)容特征和圖像質(zhì)量特征,對所述每一條酒店數(shù)據(jù)中的圖像數(shù)據(jù)進行特征提取,得到所述至少兩條酒店數(shù)據(jù)中的每一條酒店數(shù)據(jù)對應的圖像特征,包括:
根據(jù)所述每一條酒店數(shù)據(jù)中的圖像數(shù)據(jù),獲取所述每一條酒店數(shù)據(jù)中的圖像數(shù)據(jù)的圖像內(nèi)容數(shù)據(jù)和圖像質(zhì)量數(shù)據(jù);
根據(jù)所述圖像內(nèi)容數(shù)據(jù),確定所述至少兩條酒店數(shù)據(jù)中的每一條酒店數(shù)據(jù)對應的圖像內(nèi)容特征;
根據(jù)所述圖像質(zhì)量數(shù)據(jù),確定所述至少兩條酒店數(shù)據(jù)中的每一條酒店數(shù)據(jù)對應的圖像質(zhì)量特征。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,根據(jù)所述每一條酒店數(shù)據(jù)對應的圖像特征,確定所述至少兩條酒店數(shù)據(jù)中的任意兩條酒店數(shù)據(jù)對應的圖像特征的第二相似度,包括:
根據(jù)所述每一條酒店數(shù)據(jù)對應的圖像內(nèi)容特征,確定所述至少兩條酒店數(shù)據(jù)中的任意兩條酒店數(shù)據(jù)對應的圖像內(nèi)容特征的第六相似度;
根據(jù)所述每一條酒店數(shù)據(jù)對應的圖像質(zhì)量特征,確定所述至少兩條酒店數(shù)據(jù)中的任意兩條酒店數(shù)據(jù)對應的圖像質(zhì)量特征的第七相似度;
按照第二預設規(guī)則對所述第六相似度和第七相似度進行加權(quán)處理,得到所述至少兩條酒店數(shù)據(jù)中的任意兩條酒店數(shù)據(jù)對應的圖像特征的第二相似度。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京螞蜂窩網(wǎng)絡科技有限公司,未經(jīng)北京螞蜂窩網(wǎng)絡科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010084428.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類





