[發(fā)明專利]一種圖片標注詞推薦方法及裝置在審
| 申請?zhí)枺?/td> | 201310503850.9 | 申請日: | 2013-10-23 |
| 公開(公告)號: | CN104572735A | 公開(公告)日: | 2015-04-29 |
| 發(fā)明(設計)人: | 鄧志鴻;張杰;梁馨月 | 申請(專利權)人: | 華為技術有限公司;北京大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京弘權知識產權代理事務所(普通合伙) 11363 | 代理人: | 陳蕾;許偉群 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 圖片 標注 推薦 方法 裝置 | ||
技術領域
本發(fā)明涉及數據處理領域,更具體的說,涉及圖片標注詞推薦方法及裝置。
背景技術
隨著社交網站的興起和繁榮,人們越來越喜歡將自己生活中的點點滴滴記錄在社交平臺上,例如,在社交平臺上上傳自己拍攝的圖片。
在用戶上傳圖片之后,通常采用標注詞標注上傳圖片,以便于用戶對圖片存儲、歸類和分享等操作。為了方便用戶標注上傳的圖片,社交平臺提供一個存儲有大量標注詞的數據庫。在社交平臺接收到用戶上傳的圖片后,會將數據庫中預先存儲的所有標注詞全部顯示出來,以供用戶選擇適合的標注詞。
在研究和實踐過程中,發(fā)明人發(fā)現上述圖片標注詞推薦方法至少存在以下問題:
在用戶每次上傳圖片后,社交平臺都會將數據庫中所有的標注詞推薦給用戶,其中,推薦的標注詞包括很多與用戶上傳的圖片無關的標注詞,從而導致推薦給用戶的標注詞與用戶上傳的圖片的匹配度極低。而且,數據庫中標注詞的種類繁多,每個種類下標注詞的數量也非常龐大,所以用戶在數據庫中篩選適合于圖片內容的標注詞非常耗費時間。
發(fā)明內容
本發(fā)明的實施例提供一種圖片標注詞推薦方法及裝置,以使推薦的標注詞與圖片內容的匹配度高,且節(jié)省用戶篩選標注詞的時間。
為了解決上述技術問題,本發(fā)明實施例公開了如下技術方案:
第一方面,一種圖片標注詞推薦方法,包括:
獲取客戶端上傳的待標注圖片;
分別計算數據庫中每張已標注圖片與所述待標注圖片的圖像相似度;
選擇與所述待標注圖片的圖像相似度大于第一閾值的已標注圖片組成圖片組;
提取所述圖片組中每張所述已標注圖片對應的標注詞組成標注詞組;
輸出所述標注詞組中的標注詞作為所述待標注圖片的標注詞。
結合上述第一方面,在第一種可能的實現方式中,在所述提取所述圖片組中已標注圖片的標注詞組成標注詞組之后,在所述輸出所述標注詞組中的標注詞作為所述待標注圖片的標注詞之前,還包括:
分別計算所述標注詞組中的各標注詞與知識庫中各詞語的語義相似度;
選擇所述知識庫中與所述標注詞組中的標注詞的語義相似度大于第二閾值的詞語添加到所述標注詞組中。
結合上述第一方面或第一方面的第一種可能的實現方式,在第二種可能的實現方式中,所述輸出所述標注詞組中的標注詞作為所述待標注圖片的標注詞,包括:
提取所述標注詞組中各標注詞對應的已標注圖片的標注日期;
建立所述標注詞組中各標注詞與所述標注詞對應的已標注圖片的標注日期之間的對應關系;
按照所述標注日期順序輸出所述標注詞組中的標注詞作為所述待標注圖片的標注詞。
結合上述第一方面或第一方面的第一種可能的實現方式,在第三種可能的實現方式中,所述輸出所述標注詞組中的標注詞作為所述待標注圖片的標注詞,包括:
提取所述標注詞組中各標注詞對應的已標注圖片的拍攝地址;
提取所述待標注圖片的拍攝地址;
計算所述標注詞組中各標注詞對應的已標注圖片的拍攝地址與所述待標注圖片的拍攝地址之間的距離;
建立所述標注詞組中各標注詞與所述標注詞對應的已標注圖片的拍攝地址和所述待標注圖片的拍攝地址之間的距離的對應關系;
按照所述距離的大小順序輸出標注詞組中的標注詞作為待標注圖片的標注詞。
結合上述第一方面或第一方面的第一種可能的實現方式,在第四種可能的實現方式中,在所述輸出所述標注詞組中的標注詞作為所述待標注圖片的標注詞中,包括:
統計數據庫中包含所述標注詞組中每個標注詞的已標注圖片的張數;
按照所述張數順序輸出所述標注詞組中的標注詞作為所述待標注圖片的標注詞。
結合上述第一方面或第一方面的第一種可能的實現方式,在第五種可能的實現方式中,在所述輸出所述標注詞組中的標注詞作為所述待標注圖片的標注詞中,包括:
計算數據庫中所述標注詞組的每個標注詞在預設時間段內的共現次數,所述共現次數為每個標注詞與其它標注詞共同描述一張所述已標注圖片的次數;
按照所述共現次數順序輸出所述標注詞組中的標注詞作為所述待標注圖片的標注詞。
結合上述第一方面或第一方面的第一種可能的實現方式,在第六種可能的實現方式中,在所述輸出所述標注詞組中的標注詞作為所述待標注圖片的標注詞中,包括:
判斷所述標注詞組中的標注詞的數量是否大于第三閾值;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司;北京大學;,未經華為技術有限公司;北京大學;許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310503850.9/2.html,轉載請聲明來源鉆瓜專利網。





