[發(fā)明專利]一種輿情熱點(diǎn)動(dòng)態(tài)檢測方法無效
| 申請(qǐng)?zhí)枺?/td> | 201310069181.9 | 申請(qǐng)日: | 2013-03-05 |
| 公開(公告)號(hào): | CN103116651A | 公開(公告)日: | 2013-05-22 |
| 發(fā)明(設(shè)計(jì))人: | 李千目;劉婷;侯君;戚湧 | 申請(qǐng)(專利權(quán))人: | 南京理工大學(xué)常熟研究院有限公司 |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 215513 江蘇省蘇州市*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 輿情 熱點(diǎn) 動(dòng)態(tài) 檢測 方法 | ||
1.一種輿情熱點(diǎn)動(dòng)態(tài)檢測方法,其特征在于具體算法步驟如下:
步驟1,檢測一個(gè)或多個(gè)新聞網(wǎng)絡(luò)數(shù)據(jù)源,從數(shù)據(jù)源中抓取報(bào)道,解析出報(bào)道的時(shí)間、標(biāo)題和正文信息;
步驟2,采用質(zhì)心比較策略,將當(dāng)前報(bào)道與所屬類別c內(nèi)現(xiàn)有監(jiān)測到的主題進(jìn)行比較,同時(shí)考慮時(shí)間和內(nèi)容特征,計(jì)算當(dāng)前報(bào)道和現(xiàn)有監(jiān)測到的主題間的相似度,并記錄最大相似度Smax以及相似度最大的主題Es;?
步驟3,根據(jù)步驟2中計(jì)算得到的最大相似度Smax以及相似度最大的主題Es,對(duì)當(dāng)前報(bào)道采取如下措施:
a)?如果Smax小于創(chuàng)新閾值θn,則在該報(bào)道所述類別內(nèi)創(chuàng)建一個(gè)新主題;
b)?如果Smax大于θn而小于聚類閾值θc,則返回步驟1;
c)?如果Smax大于θc而小于貢獻(xiàn)閾值θt,則將當(dāng)前報(bào)道的文章歸于主題Es,但不調(diào)整Es;
d)?如果Smax大于θt,則將當(dāng)前報(bào)道的文章歸入主題Es,并調(diào)整Es;
其中,0<θn<θc<θt≤1,0<Smax≤1;
步驟4,當(dāng)一個(gè)類別處理固定數(shù)量新增報(bào)道后,對(duì)該類別內(nèi)主題兩兩比較,如果兩個(gè)主題的相似度大于合并閾值θu,則將其合并,其中,0<θu<θn≤1;
步驟5,當(dāng)一個(gè)類別處理固定數(shù)量新增報(bào)道后,對(duì)各個(gè)主題內(nèi)的報(bào)道進(jìn)行淘汰,重新計(jì)算報(bào)道和該主題的相似度S,對(duì)相似度S低于聚類閾值θc的報(bào)道進(jìn)行淘汰,然后再重新計(jì)算主題向量;
步驟6,若當(dāng)前類別內(nèi)的主題數(shù)量超過主題窗口大小,對(duì)類別內(nèi)的主題進(jìn)行排序,結(jié)合主題的時(shí)間和數(shù)量特性,從所有類別中選擇出得分最高的若干個(gè)主題,作為該類別最熱點(diǎn)的主題,并輸出主題描述和包含的報(bào)道列表,其中,主題描述的生成過程如下:
步驟a)?,讀取主題內(nèi)部權(quán)重最高的若干個(gè)特征詞;
步驟b)?,在與主題相似度大于主題閾值θe的主題內(nèi)報(bào)道中,選擇時(shí)間最近的若干篇報(bào)道的標(biāo)題,其中0<θe≤1;
步驟c),綜合步驟a)?和步驟b),輸出該主題的描述。
2.根據(jù)權(quán)利要求1所述的一種輿情熱點(diǎn)動(dòng)態(tài)檢測方法,其特征在于:步驟1中所述的新聞網(wǎng)絡(luò)數(shù)據(jù)源,當(dāng)新報(bào)道和已經(jīng)處理報(bào)道的重復(fù)度大于重復(fù)閾值θd時(shí),則認(rèn)為是重復(fù)報(bào)道,根據(jù)新報(bào)道的內(nèi)容進(jìn)行消重處理,其中0<θd≤1。
3.根據(jù)權(quán)利要求2所述的一種輿情熱點(diǎn)動(dòng)態(tài)檢測方法,其特征在于:所述的消重處理步驟為:采用文本挖掘中的相似度計(jì)算方法進(jìn)行,并在報(bào)道預(yù)處理中,對(duì)報(bào)道按照網(wǎng)絡(luò)數(shù)據(jù)來源規(guī)則和基于內(nèi)容的自動(dòng)分類相結(jié)合的方法進(jìn)行分類。
4.根據(jù)權(quán)利要求1所述的一種輿情熱點(diǎn)動(dòng)態(tài)檢測方法,其特征在于:步驟2中在計(jì)算當(dāng)前報(bào)道和現(xiàn)有監(jiān)測到的主題間的相似度S時(shí),給予權(quán)威性較高的報(bào)道以較高權(quán)重,報(bào)道的權(quán)威性采用數(shù)據(jù)源的權(quán)威性。
5.根據(jù)權(quán)利要求1所述的一種輿情熱點(diǎn)動(dòng)態(tài)檢測方法,其特征在于:步驟3中所述的主題Es通過主題內(nèi)部所有新聞中綜合權(quán)重最高的若干個(gè)特征詞來表達(dá);所述的當(dāng)前報(bào)道和主題Es之間的相似度基于向量空間模型,通過兩者的夾角余弦值來計(jì)算,同時(shí)賦予報(bào)道的標(biāo)題以較高權(quán)重。
6.根據(jù)權(quán)利要求1所述的一種輿情熱點(diǎn)動(dòng)態(tài)檢測方法,其特征在于:步驟4中所述的兩個(gè)主題的相似度S,其計(jì)算是采用如下公式:
其中,是兩個(gè)檢測到的新聞主題,分別是中的報(bào)道,是兩個(gè)報(bào)道之間的相似度,指的是兩個(gè)主題中包含的報(bào)道數(shù)目的乘積。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京理工大學(xué)常熟研究院有限公司,未經(jīng)南京理工大學(xué)常熟研究院有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310069181.9/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 一種輿情信息獲取方法及裝置
- 一種輿情歸并方法、裝置、服務(wù)器和存儲(chǔ)介質(zhì)
- 企業(yè)輿情監(jiān)測方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種輿情數(shù)據(jù)推送方法、裝置、存儲(chǔ)介質(zhì)和終端設(shè)備
- 一種輿情分析方法
- 輿情分析方法、裝置、終端設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 知識(shí)庫構(gòu)建方法及裝置
- 生成輿情專題方法、系統(tǒng)及存儲(chǔ)介質(zhì)
- 基于區(qū)塊鏈、輿情和核心算法的金融風(fēng)控系統(tǒng)
- 網(wǎng)絡(luò)輿情云平臺(tái)用戶單位變更配置的方法及系統(tǒng)
- 使用多機(jī)器學(xué)習(xí)核的光刻熱點(diǎn)檢測
- 一種釣魚熱點(diǎn)的檢測方法及系統(tǒng)
- 一種基于大數(shù)據(jù)識(shí)別釣魚熱點(diǎn)的方法和設(shè)備
- 一種快速分享熱點(diǎn)的方法及設(shè)備
- 一種信息獲取的方法、設(shè)備以及介質(zhì)
- 一種熱點(diǎn)切換的方法及設(shè)備
- 熱點(diǎn)開啟方法、裝置、終端設(shè)備及存儲(chǔ)介質(zhì)
- 熱點(diǎn)區(qū)域定位方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種城市交通出行問題熱點(diǎn)分級(jí)方法及裝置
- 一種基于無線熱點(diǎn)實(shí)現(xiàn)定位的方法與設(shè)備
- 動(dòng)態(tài)矢量譯碼方法和動(dòng)態(tài)矢量譯碼裝置
- 動(dòng)態(tài)口令的顯示方法及動(dòng)態(tài)令牌
- 動(dòng)態(tài)庫管理方法和裝置
- 動(dòng)態(tài)令牌的身份認(rèn)證方法及裝置
- 令牌、動(dòng)態(tài)口令生成方法、動(dòng)態(tài)口令認(rèn)證方法及系統(tǒng)
- 一種動(dòng)態(tài)模糊控制系統(tǒng)
- 一種基于動(dòng)態(tài)信號(hào)的POS機(jī)和安全保護(hù)方法
- 圖像動(dòng)態(tài)展示的方法、裝置、系統(tǒng)及介質(zhì)
- 一種基于POS機(jī)聚合碼功能分離顯示動(dòng)態(tài)聚合碼的系統(tǒng)
- 基于動(dòng)態(tài)口令的身份認(rèn)證方法、裝置和動(dòng)態(tài)令牌





