[發明專利]對象評價方法及裝置、存儲介質、電子裝置在審
| 申請號: | 202011443361.5 | 申請日: | 2020-12-11 |
| 公開(公告)號: | CN112906374A | 公開(公告)日: | 2021-06-04 |
| 發明(設計)人: | 陳奕銘 | 申請(專利權)人: | 中信銀行股份有限公司 |
| 主分類號: | G06F40/253 | 分類號: | G06F40/253;G06F16/31;G06F16/38;G06F16/33;G06F40/279;G06F40/211 |
| 代理公司: | 北京市蘭臺律師事務所 11354 | 代理人: | 張峰 |
| 地址: | 100020 北京市朝*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 對象 評價 方法 裝置 存儲 介質 電子 | ||
本發明實施例提供了一種對象評價方法及裝置、存儲介質、電子裝置,該方法包括:從確定的N個媒體文件中提取與目標對象相關聯的關鍵語句,得到目標對象的語料信息,其中,N個媒體文件屬于不同的媒體載體,N是大于或等于1的自然數;基于語料信息構建目標對象的詞袋;確定詞袋中每個詞在不同的媒體載體中的權重值;利用每個詞在不同的媒體載體中的權重值評價目標對象。通過本發明,解決了相關技術中語料獲取不準確,導致對對象的評價不準確的問題,達到準確的通過語料信息評價對象的效果。
技術領域
本發明實施例涉及數據處理領域,具體而言,涉及一種對象評價方法及裝置、存儲介質、電子裝置。
背景技術
以用戶評論內容建立的語料系統對于輿情監督、形象構建具有較強的普適性,往往能較為準確地監測某一時間范圍內某主體的情感詞條。不過這種語料沒有較強的結構性,所獲語料也因而不夠穩定,尤其各種媒體平臺逐漸推行反爬機制,普通用戶語料的獲取難度在日益提升,盡管有些時候語料僅用于檢測評價。
針對現有技術中存在的語料獲取不準確,導致對對象的評價不準確的問題,相關技術中尚未提出有效的解決方案。
發明內容
本發明實施例提供了一種對象評價方法及裝置、存儲介質、電子裝置,以至少解決相關技術中語料獲取不準確,導致對對象的評價不準確的問題。
根據本發明的一個實施例,提供了一種對象評價方法,包括:
從確定的N個媒體文件中提取與目標對象相關聯的關鍵語句,得到上述目標對象的語料信息,其中,上述N個媒體文件屬于不同的媒體載體,上述N是大于或等于1的自然數;
基于上述語料信息構建上述目標對象的詞袋;
確定上述詞袋中每個詞在上述不同的媒體載體中的權重值;
利用上述每個詞在上述不同的媒體載體中的權重值評價上述目標對象。
根據本發明的另一個實施例,提供了一種對象評價裝置,包括:
第一提取模塊,用于從確定的N個媒體文件中提取與目標對象相關聯的關鍵語句,得到上述目標對象的語料信息,其中,上述N個媒體文件屬于不同的媒體載體,上述N是大于或等于1的自然數;
第一構建模塊,用于基于上述語料信息構建上述目標對象的詞袋;
第一確定模塊,用于確定上述詞袋中每個詞在上述不同的媒體載體中的權重值;
第一評價模塊,用于利用上述每個詞在上述不同的媒體載體中的權重值評價上述目標對象。
在一個實例性實施例中,上述第一提取模塊,包括:
第一獲取單元,用于利用爬蟲程序從上述不同的媒體載體中獲取預設日期的上述N個媒體文件;
第一提取單元,用于提取上述N個媒體文件中與上述目標對象相關聯的每個媒體文件的標題和導語,得到上述關鍵語句;
第一確定單元,用于將上述關鍵語句確定為上述目標對象的語料信息。
在一個實例性實施例中,上述裝置還包括:
第一存儲模塊,用于在基于上述語料信息構建上述目標對象的詞袋之后,將上述語料信息存儲至數據庫中;
分配模塊,用于在上述數據庫中對上述語料信息分配對應的索引;
第二存儲模塊,用于將上述索引存儲至上述數據庫中的數據表中。
在一個實例性實施例中,上述第一確定模塊,包括:
第二確定單元,用于確定上述詞袋中每個詞在上述N個媒體文件中出現的頻率,得到上述詞袋中每個詞的詞頻;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中信銀行股份有限公司,未經中信銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011443361.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種氦氧-空氣潛水減壓控制系統及其方法
- 下一篇:緊密聯接的單模塊后處理系統





