[發(fā)明專利]一種媒體數(shù)據(jù)處理方法、裝置、介質(zhì)和設備在審
| 申請?zhí)枺?/td> | 201810596532.4 | 申請日: | 2018-06-11 |
| 公開(公告)號: | CN108984517A | 公開(公告)日: | 2018-12-11 |
| 發(fā)明(設計)人: | 杜澤壯 | 申請(專利權)人: | 杜澤壯 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06F17/30 |
| 代理公司: | 北京同達信恒知識產(chǎn)權代理有限公司 11291 | 代理人: | 黃志華 |
| 地址: | 100083 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數(shù)據(jù)平臺 媒體數(shù)據(jù) 媒體數(shù)據(jù)處理 網(wǎng)絡爬蟲技術 數(shù)據(jù)業(yè)務 全面性 預設 | ||
1.一種媒體數(shù)據(jù)處理方法,其特征在于,所述方法包括:
針對一個指定的關鍵詞,確定預設的數(shù)據(jù)平臺列表,所述數(shù)據(jù)平臺列表包括針對所述指定的關鍵詞,確定出的至少一個數(shù)據(jù)平臺,所述至少一個數(shù)據(jù)平臺對應至少一個國家和/或組織;
按照設定周期,利用網(wǎng)絡爬蟲技術分別獲取所述數(shù)據(jù)平臺列表中每個數(shù)據(jù)平臺上的媒體數(shù)據(jù)。
2.如權利要求1所述的方法,其特征在于,所述數(shù)據(jù)平臺為電視平臺、視頻網(wǎng)站平臺、微博平臺、百科平臺、社交平臺、搜索平臺、指數(shù)平臺或?qū)I(yè)媒體平臺。
3.如權利要求1或2所述的方法,其特征在于,所述媒體數(shù)據(jù)為文章時,所述方法還包括:
利用預先設計的情感分析引擎,提取每篇文章中的情感傾向詞,所述情感傾向詞為用于表示情感傾向的詞語;
根據(jù)提取出的情感傾向詞,確定每篇文章的情感值,所述情感值用于確定一篇文章的情感傾向。
4.如權利要求3所述的方法,其特征在于,所述情感傾向詞包括否定詞、程度詞和情感詞,所述否定詞為用于表示否定意義的詞語,所述程度詞為用于表示程度的詞語,所述情感詞為用于表示情感的詞語。
5.如權利要求4所述的方法,其特征在于,根據(jù)提取出的否定詞、程度詞和情感詞,確定每篇文章的情感值,包括:
根據(jù)提取出的否定詞、程度詞和情感詞,確定一篇文章中每個句子的情感值;
根據(jù)每個句子的情感值,確定每個段落的情感值;
根據(jù)每個段落的情感值,確定一篇文章的情感值。
6.如權利要求5所述的方法,其特征在于,通過以下公式,確定一個句子的情感值S:
S=W1×W2×W3
其中,W1表示一個句子中否定詞的權重;
W2表示一個句子中程度詞的權重;
W3表示一個句子中情感詞的權重;
且,W1=(N+2)×(-1)
N表示一個句子中否定詞的個數(shù);
k表示一個句子中程度詞的個數(shù),Ki表示一個句子中每個程度詞的預設分值;
l表示一個句子中情感詞的個數(shù),Lj表示一個句子中每個情感詞的預設分值;
通過以下公式,確定一個段落的情感值D:
p表示一個段落中句子的個數(shù),Sm表示一個段落中每個句子的情感值;
通過以下公式,確定一篇文章的情感值A:
q表示一篇文章中段落的個數(shù),Dn表示一篇文章中每個段落的情感值。
7.一種媒體數(shù)據(jù)處理裝置,其特征在于,所述裝置包括:
確定模塊,用于針對一個指定的關鍵詞,確定預設的數(shù)據(jù)平臺列表,所述數(shù)據(jù)平臺列表包括針對所述指定的關鍵詞,確定出的至少一個數(shù)據(jù)平臺,所述至少一個數(shù)據(jù)平臺對應至少一個國家和/或組織;
獲取模塊,用于按照設定周期,利用網(wǎng)絡爬蟲技術分別獲取所述數(shù)據(jù)平臺列表中每個數(shù)據(jù)平臺上的媒體數(shù)據(jù)。
8.如權利要求7所述的裝置,其特征在于,所述數(shù)據(jù)平臺為電視平臺、視頻網(wǎng)站平臺、微博平臺、百科平臺、社交平臺、搜索平臺、指數(shù)平臺或?qū)I(yè)媒體平臺。
9.如權利要求7或8所述的裝置,其特征在于,所述裝置還包括分析模塊:
所述媒體數(shù)據(jù)為文章時,所述分析模塊,用于利用預先設計的情感分析引擎,提取每篇文章中的情感傾向詞,所述情感傾向詞為用于表示情感傾向的詞語;根據(jù)提取出的情感傾向詞,確定每篇文章的情感值,所述情感值用于確定一篇文章的情感傾向。
10.如權利要求9所述的裝置,其特征在于,所述情感傾向詞包括否定詞、程度詞和情感詞,所述否定詞為用于表示否定意義的詞語,所述程度詞為用于表示程度的詞語,所述情感詞為用于表示情感的詞語。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杜澤壯,未經(jīng)杜澤壯許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810596532.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)字媒體數(shù)據(jù)處理方法、裝置、系統(tǒng)及服務器
- 多媒體無線傳輸設備
- 多媒體數(shù)據(jù)處理平臺及多媒體讀物、系統(tǒng)和方法
- 一種多媒體訊號控制裝置及其控制方法
- 具數(shù)據(jù)保護功能的電視控制芯片與控制電視裝置的方法
- 數(shù)據(jù)處理系統(tǒng)
- 媒體數(shù)據(jù)的處理方法及裝置、計算機存儲介質(zhì)、計算機設備
- 多媒體數(shù)據(jù)處理和獲取方法、采集終端和處理裝置
- 多媒體數(shù)據(jù)處理方法、裝置、系統(tǒng)、電子設備及存儲介質(zhì)
- 一種網(wǎng)絡爬蟲方法及裝置
- 一種監(jiān)控網(wǎng)絡爬蟲的方法、裝置和系統(tǒng)
- 一種基于隱馬爾可夫模型的惡意網(wǎng)絡爬蟲檢測方法
- 一種網(wǎng)絡爬蟲方法及系統(tǒng)
- 網(wǎng)絡爬蟲系統(tǒng)的測試方法及裝置、存儲介質(zhì)、電子設備
- 一種分布式爬蟲系統(tǒng)及其實現(xiàn)方法
- 網(wǎng)絡爬蟲檢測方法、裝置、存儲介質(zhì)及電子設備
- 網(wǎng)絡爬蟲的識別方法及裝置、計算機可讀存儲介質(zhì)
- 一種基于行為平衡度的垂直類網(wǎng)絡爬蟲檢測識別方法
- 一種大數(shù)據(jù)防爬蟲處理方法及云平臺系統(tǒng)





