[發明專利]OTA圖片標簽的識別方法、電子設備和介質有效
| 申請號: | 201910934233.1 | 申請日: | 2019-09-29 |
| 公開(公告)號: | CN110704650B | 公開(公告)日: | 2023-04-25 |
| 發明(設計)人: | 成丹妮;羅超;胡泓 | 申請(專利權)人: | 攜程計算機技術(上海)有限公司 |
| 主分類號: | G06F16/51 | 分類號: | G06F16/51;G06F16/58;G06F16/583 |
| 代理公司: | 上海弼興律師事務所 31283 | 代理人: | 薛琦;張冉 |
| 地址: | 200335 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | ota 圖片 標簽 識別 方法 電子設備 介質 | ||
本發明公開了一種OTA圖片標簽的識別方法、電子設備和介質,其中OTA圖片標簽的識別方法,包括以下步驟:根據OTA圖片庫構建OTA圖像標簽數據集,OTA圖片庫包括OTA圖片和與OTA圖片對應的標簽;根據OTA圖像標簽數據集建立標簽關系模型;根據標簽關系模型建立圖像特征提取模型,并提取圖像特征;根據圖像特征建立標簽識別模型;采用標簽識別模型識別待測OTA圖片的標簽。本發明基于OTA酒店下的海量圖片信息和當前存在的標簽,利用深度學習的方法對圖片進行自動化標簽識別。
技術領域
本發明屬于OTA圖片標簽的識別技術領域,尤其涉及一種OTA圖片標簽的識別方法、電子設備和介質。
背景技術
圖像可對信息提供直觀表示與傳達,因此在OTA(在線旅游)場景中得到大規模應用。有效準確地展示圖像能極大地提升用戶體驗,從而提高用戶的轉化率。OTA圖像中內容通常比較復雜,單幅圖像往往含有多個語義,具有多個標簽屬性。而現有技術中,對圖像標簽的識別往往采用人工方式,耗時很長,效率低,成本高,準確率低。
發明內容
本發明要解決的技術問題是為了克服現有技術中的缺陷,提供一種OTA圖片標簽的識別方法、電子設備和介質。
本發明是通過下述技術方案來解決上述技術問題:
本發明提供一種OTA圖片標簽的識別方法,包括以下步驟:
根據OTA圖片庫構建OTA圖像標簽數據集,OTA圖片庫包括OTA圖片和與OTA圖片對應的標簽;
根據OTA圖像標簽數據集建立標簽關系模型;
根據標簽關系模型建立圖像特征提取模型,并提取圖像特征;
根據圖像特征建立標簽識別模型;
采用標簽識別模型識別待測OTA圖片的標簽。
較佳地,根據OTA圖片庫構建OTA圖像標簽數據集的步驟包括:
統計OTA圖片庫中的標簽出現的次數;
獲取目標標簽,目標標簽為出現的次數大于預設數值的標簽;
構建OTA圖像標簽數據集,OTA圖像標簽數據集包括目標標簽和目標圖片,目標圖片為OTA圖片庫中與目標標簽對應的圖片。
較佳地,根據OTA圖像標簽數據集建立標簽關系模型的步驟包括:
通過one-hot(一種編碼方式)的形式將目標標簽轉換為標簽向量,并根據目標標簽出現的次數構建標簽關系有向圖,在標簽關系有向圖中,第i個目標標簽到第j個目標標簽的變換系數zij滿足以下公式:
zij=qij/qi
其中,qi表示OTA圖像標簽數據集中包括第i個目標標簽的目標圖片的數量,qij表示OTA圖像標簽數據集中同時包括第i個目標標簽和第j個目標標簽的目標圖片的數量,i∈[1,N],j∈[1,N],N為目標標簽的類別的數量。目標標簽包括圖片中可識別的內容以及其屬性和照片的拍攝環境,如山、大海、白天、夜晚、建筑局部、建筑全景等。
較佳地,根據OTA圖像標簽數據集建立標簽關系模型的步驟還包括:
通過圖卷積變換將目標標簽轉換為標簽關系矩陣W,標簽關系矩陣W用于表征標簽關系模型,D的維度與卷積神經網絡的特征變換函數F(X)的輸出特征維度一致。用于表征實數域。
較佳地,圖像特征提取模型的傳輸函數為:
L=W·F(X),
其中,F(X)為卷積神經網絡的特征變換函數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于攜程計算機技術(上海)有限公司,未經攜程計算機技術(上海)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910934233.1/2.html,轉載請聲明來源鉆瓜專利網。





