[發(fā)明專利]一種基于組合優(yōu)化決策樹的網(wǎng)絡(luò)偽輿情識(shí)別方法在審
| 申請(qǐng)?zhí)枺?/td> | 201710839631.6 | 申請(qǐng)日: | 2017-09-18 |
| 公開(公告)號(hào): | CN107742256A | 公開(公告)日: | 2018-02-27 |
| 發(fā)明(設(shè)計(jì))人: | 高萬林;康博涵;賈敬敦;于麗娜;陶莎;仲貞 | 申請(qǐng)(專利權(quán))人: | 中國(guó)農(nóng)業(yè)大學(xué) |
| 主分類號(hào): | G06Q50/00 | 分類號(hào): | G06Q50/00;G06F17/30;G06K9/62 |
| 代理公司: | 北京路浩知識(shí)產(chǎn)權(quán)代理有限公司11002 | 代理人: | 王瑩,李相雨 |
| 地址: | 100193 *** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 組合 優(yōu)化 決策樹 網(wǎng)絡(luò) 輿情 識(shí)別 方法 | ||
1.一種基于組合優(yōu)化決策樹的網(wǎng)絡(luò)偽輿情識(shí)別方法,其特征在于,包括:
S1,獲取網(wǎng)絡(luò)輿情事件的輿情屬性集合,其中,所述輿情屬性集合包括首發(fā)媒介、轉(zhuǎn)發(fā)媒介種類及個(gè)數(shù)、總發(fā)帖數(shù)、48小時(shí)發(fā)帖數(shù)、一周發(fā)帖數(shù)、持續(xù)時(shí)長(zhǎng)、觀點(diǎn)數(shù)、最大觀點(diǎn)占比和轉(zhuǎn)發(fā)數(shù)中的一個(gè)或多個(gè);
S2,將所述輿情屬性集合中的至少一種輿情屬性對(duì)應(yīng)的輿情屬性值,輸入至決策樹模型中,獲取所述網(wǎng)絡(luò)輿情事件的識(shí)別結(jié)果。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,步驟S2中所述決策樹模型通過以下步驟獲?。?/p>
S21,獲取多個(gè)輿情樣本事件,每個(gè)所述輿情樣本事件包含所述輿情屬性集合;
S22,將所述多個(gè)輿情樣本事件隨機(jī)分為訓(xùn)練集和測(cè)試集,所述訓(xùn)練集和所述測(cè)試集均包含至少一個(gè)所述輿情樣本事件;
S23,根據(jù)所述訓(xùn)練集中的所有輿情樣本事件的輿情屬性集合,建立所述決策樹模型。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,步驟S23具體包括:
S231,利用基于邊界點(diǎn)屬性值合并和不一致度檢驗(yàn)的離散化算法,將所述訓(xùn)練集中的所有輿情樣本事件的連續(xù)輿情屬性離散化為離散輿情屬性;
S232,根據(jù)所述訓(xùn)練集中的所有輿情樣本事件的離散輿情屬性和定性輿情屬性,利用輸入輸出關(guān)聯(lián)法建立所述決策樹模型。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,步驟S231具體包括:
S2311,基于所述訓(xùn)練集中的所有輿情樣本事件的每一個(gè)連續(xù)輿情屬性,以所述每一個(gè)連續(xù)輿情屬性的邊界點(diǎn)的屬性值為切點(diǎn)分割對(duì)應(yīng)的連續(xù)輿情屬性的屬性值,獲取所述每一個(gè)連續(xù)輿情屬性的第一離散輿情屬性區(qū)間集合;
S2312,合并所述每一個(gè)連續(xù)輿情屬性的第一離散輿情屬性區(qū)間集合中的臨界點(diǎn),獲取所述每一個(gè)連續(xù)輿情屬性的第二離散輿情屬性區(qū)間集合;
S2313,合并所述每一個(gè)連續(xù)輿情屬性的第二離散輿情屬性區(qū)間集合中的少數(shù)點(diǎn)區(qū)間,獲取所述每一個(gè)連續(xù)輿情屬性的第三離散輿情屬性區(qū)間集合;
S2314,若任一所述第三離散輿情屬性區(qū)間集合的不一致度高于所述不一致度閾值,則調(diào)整所述任一所述第三離散輿情屬性區(qū)間集合,直至調(diào)整后的第三離散輿情屬性區(qū)間集合的不一致度低于所述不一致度閾值。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,步驟S2314中所述調(diào)整所述第三離散輿情屬性區(qū)間集合為:對(duì)所述少數(shù)點(diǎn)區(qū)間進(jìn)行恢復(fù)。
6.根據(jù)權(quán)利要求3所述的方法,其特征在于,步驟S232具體包括:
S2321,在所述訓(xùn)練集中的所有輿情樣本事件中,獲取每一輿情屬性的歸一化輸入輸出關(guān)聯(lián)值;
S2322,選取所述歸一化輸入輸出關(guān)聯(lián)值較大的一個(gè)或多個(gè)所述輿情屬性作為基本輿情屬性集合,其余輿情屬性作為備選輿情屬性集合;
S2323、根據(jù)所述基本輿情屬性集合和備選輿情屬性集合,以所述歸一化輸入輸出關(guān)聯(lián)值為節(jié)點(diǎn)輿情屬性選擇標(biāo)準(zhǔn),建立所述決策樹模型。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國(guó)農(nóng)業(yè)大學(xué),未經(jīng)中國(guó)農(nóng)業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710839631.6/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種抗疲勞金屬配件
- 下一篇:一種高性能機(jī)械零件
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的處理系統(tǒng)或方法
G06Q50-00 專門適用于特定經(jīng)營(yíng)部門的系統(tǒng)或方法,例如公用事業(yè)或旅游
G06Q50-02 .農(nóng)業(yè);漁業(yè);礦業(yè)
G06Q50-04 .制造業(yè)
G06Q50-06 .電力、天然氣或水供應(yīng)
G06Q50-08 .建筑
G06Q50-10 .服務(wù)





