[發(fā)明專利]一種基于評(píng)論樹的在線社交媒體新聞爭(zhēng)議性檢測(cè)方法在審
| 申請(qǐng)?zhí)枺?/td> | 202210124657.3 | 申請(qǐng)日: | 2022-02-10 |
| 公開(公告)號(hào): | CN114625944A | 公開(公告)日: | 2022-06-14 |
| 發(fā)明(設(shè)計(jì))人: | 閔勇;衛(wèi)寧;宣琦;傅晨波;龍杰 | 申請(qǐng)(專利權(quán))人: | 浙江工業(yè)大學(xué) |
| 主分類號(hào): | G06F16/906 | 分類號(hào): | G06F16/906;G06F16/9536;G06K9/62 |
| 代理公司: | 杭州天正專利事務(wù)所有限公司 33201 | 代理人: | 王兵;孫家豐 |
| 地址: | 310014 浙*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 評(píng)論 在線 社交 媒體 新聞 爭(zhēng)議 檢測(cè) 方法 | ||
1.一種在線社交媒體新聞爭(zhēng)議性檢測(cè)方法,其特征在于,包括:
S1:預(yù)設(shè)主題的新聞及評(píng)論收集:從在線社交媒體的熱門主題中選擇爭(zhēng)議性主題和非爭(zhēng)議性主題,收集一段時(shí)間內(nèi)每個(gè)主題中的所有新聞及其所有評(píng)論,解析為可讀模式并進(jìn)行整理,得到在線社交媒體新聞及評(píng)論數(shù)據(jù)集;
S2:提取評(píng)論樹的多維度特征:讀取上述的在線社交媒體新聞及評(píng)論數(shù)據(jù)集中的文本內(nèi)容、回復(fù)關(guān)系、用戶信息,根據(jù)以上信息對(duì)每一個(gè)新聞構(gòu)建評(píng)論樹,并提取評(píng)論樹的多維度特征作為訓(xùn)練數(shù)據(jù)集;
S3:訓(xùn)練新聞爭(zhēng)議性檢測(cè)模型:將上述的訓(xùn)練數(shù)據(jù)集中,對(duì)于每個(gè)維度特征使用一個(gè)弱分類器進(jìn)行訓(xùn)練,之后對(duì)這些弱分類器通過Boosting方法訓(xùn)練強(qiáng)分類器,得到新聞爭(zhēng)議性檢測(cè)模型;
S4:模型預(yù)測(cè):對(duì)待檢測(cè)的新聞,獲取其新聞及評(píng)論,解析為可讀模式并進(jìn)行整理,根據(jù)獲取的信息構(gòu)建評(píng)論樹,提取該待檢測(cè)新聞的評(píng)論樹多維度特征作為輸入,通過新聞爭(zhēng)議性檢測(cè)模型,得到該待檢測(cè)新聞的爭(zhēng)議性檢測(cè)結(jié)果。
2.如權(quán)利要求1所述的在線社交媒體新聞爭(zhēng)議性檢測(cè)方法,其特征在于,所述步驟S1具體包括:
S1.1:從在線社交媒體的熱門主題中篩選主題,區(qū)分為兩種類型,分別是爭(zhēng)議性主題和非爭(zhēng)議性主題,區(qū)分的標(biāo)準(zhǔn)為該主題中的新聞是否容易引起爭(zhēng)論,是則為爭(zhēng)議性主題,反之則為非爭(zhēng)議性主題;
S1.2:收集一定時(shí)間范圍內(nèi)在線社交媒體中上述預(yù)設(shè)主題的所有新聞及所有評(píng)論,解析為可讀模式并進(jìn)行整理,對(duì)每一個(gè)新聞添加所屬主題的爭(zhēng)議性作為標(biāo)簽,得到在線社交媒體新聞及評(píng)論數(shù)據(jù)集。
3.如權(quán)利要求1所述的在線社交媒體新聞爭(zhēng)議性檢測(cè)方法,其特征在于,所述步驟S2具體包括:
S2.1:提取在線社交媒體新聞及評(píng)論數(shù)據(jù)集中的新聞及評(píng)論的文本內(nèi)容、回復(fù)關(guān)系、用戶信息;
S2.2:根據(jù)以上信息對(duì)每個(gè)新聞構(gòu)建評(píng)論樹;
S2.3:從每個(gè)新聞的評(píng)論樹中提取以下38個(gè)特征,選取全部或者其中部分特征作為評(píng)論樹的多維度特征,采用one-hot編碼,分類標(biāo)簽為新聞所屬的主題爭(zhēng)議性,作為訓(xùn)練數(shù)據(jù)集,所有特征如下:
1.評(píng)論樹的評(píng)論數(shù)量
2.評(píng)論樹的用戶數(shù)
3.邊的數(shù)量
4.評(píng)論的節(jié)點(diǎn)度數(shù)
5.評(píng)論樹節(jié)點(diǎn)的平均度數(shù)
6.評(píng)論樹節(jié)點(diǎn)的最大度數(shù)
7.評(píng)論在評(píng)論樹中的深度
8.評(píng)論樹的平均深度
9.評(píng)論樹的最大深度
10.評(píng)論樹中子樹的數(shù)量
11.評(píng)論樹的平均子樹大小
12.評(píng)論樹的最大子樹大小
13.評(píng)論的發(fā)布時(shí)間
14.評(píng)論樹的平均回復(fù)時(shí)間間隔
15.評(píng)論樹的最大回復(fù)時(shí)間間隔
16.評(píng)論樹的最小回復(fù)時(shí)間間隔
17.評(píng)論文本的長度
18.評(píng)論文本內(nèi)容的情感傾向
19.評(píng)論文本內(nèi)容的字符數(shù)
20.評(píng)論文本內(nèi)容的語氣詞數(shù)量
21.評(píng)論文本內(nèi)容的語氣詞數(shù)量占該評(píng)論詞數(shù)的比例
22.評(píng)論文本內(nèi)容的否定詞數(shù)量
23.評(píng)論文本內(nèi)容的否定詞數(shù)量占該評(píng)論詞數(shù)的比例
24.評(píng)論文本內(nèi)容的強(qiáng)程度詞數(shù)目
25.評(píng)論文本內(nèi)容的強(qiáng)程度詞數(shù)目占該評(píng)論詞數(shù)的比例
26.評(píng)論文本內(nèi)容的弱程度詞數(shù)目
27.評(píng)論文本內(nèi)容的弱程度詞數(shù)目占該評(píng)論詞數(shù)的比例
28.評(píng)論文本內(nèi)容的不確定程度詞數(shù)
29.評(píng)論文本內(nèi)容的不確定程度詞數(shù)占該評(píng)論詞數(shù)的比例
30.評(píng)論文本內(nèi)容的轉(zhuǎn)折詞數(shù)
31.評(píng)論文本內(nèi)容的轉(zhuǎn)折詞數(shù)占該評(píng)論詞數(shù)的比例
32.評(píng)論文本內(nèi)容的第一、二、三人稱代詞的數(shù)目
33.評(píng)論文本內(nèi)容的第一、二、三人稱代詞的數(shù)目占該評(píng)論詞數(shù)的比例
34.評(píng)論的點(diǎn)贊數(shù)
35.評(píng)論二元motif的數(shù)量
36.評(píng)論二元motif在評(píng)論樹中評(píng)論節(jié)點(diǎn)覆蓋率
37.評(píng)論二元點(diǎn)贊差異motif的數(shù)量
38.評(píng)論二元點(diǎn)贊差異motif的數(shù)量占評(píng)論二元motif的比例。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江工業(yè)大學(xué),未經(jīng)浙江工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210124657.3/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 全球評(píng)論板系統(tǒng)及其實(shí)現(xiàn)方法
- 一種評(píng)論推薦方法和系統(tǒng)
- 評(píng)論內(nèi)容的提供方法、裝置和終端設(shè)備
- 評(píng)論信息確定方法、裝置、服務(wù)器及存儲(chǔ)介質(zhì)
- 基于人工智能構(gòu)建評(píng)論圖譜的方法和裝置
- 一種電子商務(wù)產(chǎn)品評(píng)論質(zhì)量鑒別系統(tǒng)
- 音頻文件的評(píng)論方法及裝置
- 評(píng)論的展示方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 在線評(píng)論篩選裝置
- 用于生成評(píng)論的方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 用于呈現(xiàn)在線實(shí)體在線狀態(tài)的系統(tǒng)和方法
- 提供web服務(wù)接入的在線系統(tǒng)和方法
- 定制在線圖標(biāo)
- 一種水質(zhì)在線檢測(cè)預(yù)處理裝置
- 在線測(cè)試學(xué)習(xí)方法、系統(tǒng)、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種在線文檔的分頁方法、裝置、設(shè)備以及可讀介質(zhì)
- 一種基于web在線學(xué)習(xí)的資源訪問平臺(tái)
- 一種在線學(xué)習(xí)系統(tǒng)
- 在線文檔提交方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 空調(diào)冷媒量確定方法、系統(tǒng)和可讀存儲(chǔ)介質(zhì)
- 社交網(wǎng)絡(luò)裝置成員資格和應(yīng)用
- 一種社交對(duì)象搜索方法及裝置
- 針對(duì)嵌入式應(yīng)用上下文中的搜索的查詢意圖表達(dá)
- 一種關(guān)鍵社交信息的確定方法及裝置
- 社交網(wǎng)絡(luò)數(shù)據(jù)的可視化方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 動(dòng)態(tài)社交圈確定方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 控制社交分享信息在社交空間的呈現(xiàn)狀態(tài)的方法與設(shè)備
- 社交角色管理方法、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 基于社交關(guān)系的社交屬性數(shù)據(jù)確定方法、裝置及設(shè)備
- 一種社交賬戶推薦方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)





