[發明專利]一種網絡圖片輿情監測方法在審
| 申請號: | 201710280955.0 | 申請日: | 2017-04-26 |
| 公開(公告)號: | CN107122450A | 公開(公告)日: | 2017-09-01 |
| 發明(設計)人: | 郭怡適;黃耀鴻;陳城;楊湧 | 申請(專利權)人: | 廣州圖匠數據科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 廣州三環專利商標代理有限公司44202 | 代理人: | 郝傳鑫 |
| 地址: | 510000 廣東省廣州*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 網絡 圖片 輿情 監測 方法 | ||
技術領域
本發明涉及一種網絡輿情監測方法。
背景技術
隨著互聯網在全球范圍內的大量普及,網絡媒體成為傳播社會信息的主要載體之一,并且網絡媒體包含了專業媒體以及群眾、消費者等更廣泛的聲音。品牌企業需要知道消費者、媒體在網絡各個平臺上對自身品牌形象、產品的評價,政府部門以及公眾人物也需要了解網絡各個渠道群眾、媒體的正負面聲音。對于政府部門、品牌企業、公眾人物來說,了解網絡輿情有利于發現問題并快速對自身作出調整。
目前的網絡輿情監測方法均是通過關鍵字匹配或文字OCR識別技術,抓取網絡各個平臺上相關的新聞、社交動態、網民評論等網絡輿情信息。在這種情況下,只有包含相關關鍵字文本的數據才會被處理,聲量只是文字聲量,針對只有圖片而沒有相關關鍵字的內容卻不能被搜索到。例如,越來越多的消費者喜歡用圖片來表達情感,他們可能沒有提及到某些關鍵詞,但卻用圖片傳遞了同樣的信息,微博真實用戶每日所發的圖片就達數百萬張。目前由于缺乏有效的識別手段,圖片數據是長期存在的監測盲區。
中國專利201310395230.8公開了一種圖片搜索系統,,包括以下程序:(1)圖片搜索系統進行關鍵字搜索,關鍵字包括顏色、形狀、質地、通用名稱和品質表征,(2)進行圖片檢索,用戶首先對檢索圖片進行分類,標示出主要進行檢索的區域,使用圖片檢索系統中的抓取鍵抓取圖片中的關鍵部分,然后點擊確認按鈕進行檢索,圖片檢索系統會自動檢索出所有含有該抓取部分的圖片集,并且按照相似度,進行排列,(3)進行圖片對比,所述圖片搜索系統還包括圖片對比功能,圖片搜索軟件將用戶圖片與搜索到的圖片進行對比,找出其中的相同點和不同點,確認圖片的相似度和相似比例。通過上述方式,本發明圖片搜索系統不僅能夠通過關鍵字進行圖片搜索,還能夠通過抓取圖片的關鍵部分進行圖片搜索,并且能夠將搜索到的圖片與原始圖片進行對比,使用效果好、檢索效率高、有效識別出山寨圖片、彌補了現階段對于圖片搜索和圖片對比的空白。
中國專利201410189773.9公開了一種圖片搜索方法及裝置,其中,圖片搜索方法包括:獲得客戶端發送的當前圖片,從當前圖片中提取出當前特征,根據當前特征對倒排索引庫進行檢索,獲取倒排索引值,其中,倒排索引庫中包含多個與圖片的特征一一對應的鏈表;根據倒排索引值對對應的鏈表進行歸并排序處理;以及根據處理后的結果向客戶端返回檢索結果,以便向用戶顯示。本發明實施例,提取獲得的當前圖片的當前特征,根據當前特征對包含多個鏈表的倒排索引庫進行檢索獲取倒排索引值,根據倒排索引值對對應的鏈表進行歸并排序處理,并向用戶顯示檢索結果,操作方便、實現簡單,克服了依賴文字的輸入來獲取結果的不便。
上述兩個專利都在圖片信息搜索方面提供了搜索方法,依據標記關鍵部分或者特征索引獲得與目標圖片的相似度和相關性并進行排序處理,根據排序結果向用戶顯示檢索結果。此方法并不能全面完整地獲得相關純圖片的搜索結果,因此無法全方位地獲知網絡輿情信息。
發明內容
針對現有技術的缺點,本發明的目的是提供一種圖片輿情信息搜索方法,使用該方法可以將網絡上不包含相關關鍵字的純圖片信息一并搜索到,使獲得的輿情信息更全面,更確切。
為了實現上述目的,本發明提供了一種網絡圖片輿情監測方法用來監測網絡輿情信息,該方法具體包括如下步驟:
S1、根據需要搜索的信息輸入關鍵字進行全網爬蟲搜索相關圖片;
S2、所述步驟S1中搜索到的圖片集作為訓練樣本數據,對樣本圖片中的目標圖像進行標注;
S3、將所述步驟S2中標注過的樣本圖片集交給訓練機進行模式訓練,得到具備識別目標圖像能力的識別引擎;
S4、所述識別引擎在全網進行全網爬蟲搜索相關信息并進行識別。
本發明基于深度學習的圖像識別先進技術和網絡爬蟲技術進行網絡圖片輿情信息監測。通過用戶關鍵字信息全網爬蟲搜索相關的網絡圖片作為訓練機模式訓練學習的樣本圖片集,訓練完成后得到具備圖像識別能力的識別引擎,再通過識別引擎基于全網爬蟲搜索相關圖片并識別抓取,此時不僅能夠搜索到包含關鍵字的圖片還能搜索到不包含關鍵字的純圖片。因此,通過本方法監測輿情填補了純圖片輿情這一缺口,能夠全方位地獲知網絡輿情。
根據本發明另一具體實施方式,步驟S3模式訓練進一步包括目標檢測訓練和分類訓練。
根據本發明另一具體實施方式,目標檢測訓練根據圖像物體檢測模型進行目標檢測與提取,該圖像物體檢測模型基于卷積神經網絡建立。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州圖匠數據科技有限公司,未經廣州圖匠數據科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710280955.0/2.html,轉載請聲明來源鉆瓜專利網。





