[發(fā)明專利]基于微博的分析及視圖展示方法與系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 202011035414.X | 申請(qǐng)日: | 2020-09-27 |
| 公開(kāi)(公告)號(hào): | CN112148946A | 公開(kāi)(公告)日: | 2020-12-29 |
| 發(fā)明(設(shè)計(jì))人: | 王天宇;郭凌峰;楊鐳;黃北辰;齊婧含 | 申請(qǐng)(專利權(quán))人: | 深圳壹賬通智能科技有限公司 |
| 主分類(lèi)號(hào): | G06F16/951 | 分類(lèi)號(hào): | G06F16/951;G06F40/205;G06F40/216;G06F40/289;G06T11/20;G06F16/34 |
| 代理公司: | 北京英特普羅知識(shí)產(chǎn)權(quán)代理有限公司 11015 | 代理人: | 鄧小玲 |
| 地址: | 518000 廣東省深圳市前海深港合作區(qū)前*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 分析 視圖 展示 方法 系統(tǒng) | ||
1.一種基于微博的分析及視圖展示方法,其特征在于,包括:
爬取多個(gè)與關(guān)鍵詞相關(guān)的多篇微博文章及每篇所述微博文章對(duì)應(yīng)的熱點(diǎn)數(shù)據(jù),所述熱點(diǎn)數(shù)據(jù)包括發(fā)布時(shí)間、轉(zhuǎn)發(fā)用戶、文本信息與轉(zhuǎn)發(fā)量;
分析每篇所述微博文章的所述轉(zhuǎn)發(fā)量、所述發(fā)布時(shí)間、所述文本信息以及所述轉(zhuǎn)發(fā)用戶,以根據(jù)分析結(jié)果繪制多個(gè)可視化圖;
根據(jù)所述轉(zhuǎn)發(fā)量與所述轉(zhuǎn)發(fā)用戶為所述文本信息設(shè)置對(duì)應(yīng)的標(biāo)簽;
根據(jù)預(yù)設(shè)的加權(quán)算法對(duì)所述文本信息進(jìn)行分詞,得到目標(biāo)關(guān)鍵詞;
基于分類(lèi)器與所述標(biāo)簽對(duì)所述目標(biāo)關(guān)鍵詞進(jìn)行分析,得到影響力系數(shù),并根據(jù)所述影響力系數(shù)繪制預(yù)警圖;
將所述多個(gè)可視化圖與所述預(yù)警圖發(fā)送給前端進(jìn)行視圖展示。
2.根據(jù)權(quán)利要求1所述的分析及視圖展示方法,其特征在于,所述分析每篇所述微博文章的所述轉(zhuǎn)發(fā)量、所述發(fā)布時(shí)間、所述文本信息以及所述轉(zhuǎn)發(fā)用戶,以根據(jù)分析結(jié)果繪制多個(gè)可視化圖包括:
根據(jù)預(yù)設(shè)時(shí)間間隔對(duì)每篇所述微博文章的轉(zhuǎn)發(fā)量進(jìn)行統(tǒng)計(jì),按所述發(fā)布時(shí)間對(duì)每篇所述微博文章進(jìn)行排序,并繪制時(shí)間流程圖;
分析每篇所述微博文章的所述轉(zhuǎn)發(fā)量、所述文本信息以及所述轉(zhuǎn)發(fā)用戶,得到每篇所述微博文章對(duì)應(yīng)的曝光度、用戶質(zhì)量值、傳播范圍值以及情感指數(shù);
根據(jù)所述曝光度、所述用戶質(zhì)量值、所述傳播范圍值與情感指數(shù)進(jìn)行繪制,得到分析圖;
分析所述文本信息以及所述文本信息對(duì)應(yīng)的情感指數(shù),得到爆點(diǎn)指數(shù),根據(jù)所述爆點(diǎn)指數(shù)生成預(yù)警信息,并繪制爆點(diǎn)傳播圖,其中,所述多個(gè)可視化圖包括所述時(shí)間流程圖、所述分析圖與所述爆點(diǎn)傳播圖。
3.根據(jù)權(quán)利要求2所述的分析及視圖展示方法,其特征在于,所述分析每篇所述微博文章的所述轉(zhuǎn)發(fā)量與所述轉(zhuǎn)發(fā)用戶,得到每篇所述微博文章對(duì)應(yīng)的用戶質(zhì)量值包括:
獲取每篇所述微博文章的轉(zhuǎn)發(fā)用戶,根據(jù)所述轉(zhuǎn)發(fā)用戶的粉絲數(shù)量得到非噪音用戶;
計(jì)算所述轉(zhuǎn)發(fā)用戶中的非噪音用戶的數(shù)量占比;
獲取所述非噪音用戶的日轉(zhuǎn)發(fā)量;
根據(jù)所述日轉(zhuǎn)發(fā)量與所述數(shù)量占比計(jì)算每個(gè)所述微博文章的用戶質(zhì)量值。
4.根據(jù)權(quán)利要求3所述的分析及視圖展示方法,其特征在于,所述分析每篇所述微博文章的所述轉(zhuǎn)發(fā)用戶,得到每篇所述微博文章對(duì)應(yīng)傳播范圍值包括
根據(jù)所述非噪音用戶的目標(biāo)位置,統(tǒng)計(jì)每篇所述微博文章的傳播范圍值。
5.根據(jù)權(quán)利要求1所述的分析及視圖展示方法,其特征在于,所述分析每篇所述微博文章的所述文本信息,得到每篇所述微博文章對(duì)應(yīng)情感指數(shù)包括:
獲取每篇所述微博文章的文本信息;
根據(jù)相似度算法計(jì)算每條所述文本信息之間的相似度值,以根據(jù)相似度值去除重復(fù)文本信息,得到真實(shí)文本;
對(duì)所述真實(shí)文本進(jìn)行自然語(yǔ)言處理,得到多個(gè)情感文本;
根據(jù)情感分析模型對(duì)所述情感文本進(jìn)行計(jì)算,得到每篇所述微博文章的情感指數(shù)。
6.根據(jù)權(quán)利要求5所述的分析及視圖展示方法,其特征在于,所述根據(jù)所述轉(zhuǎn)發(fā)量與所述轉(zhuǎn)發(fā)用戶為所述文本信息設(shè)置對(duì)應(yīng)的標(biāo)簽包括:
當(dāng)所述微博文章的所述轉(zhuǎn)發(fā)量大于第一預(yù)設(shè)閾值且所述轉(zhuǎn)發(fā)用戶的粉絲數(shù)量小于第二預(yù)設(shè)閾值時(shí),為所述微博文章對(duì)應(yīng)的所述文本信息設(shè)置第一標(biāo)簽;
當(dāng)所述微博文章的所述轉(zhuǎn)發(fā)量小于第一預(yù)設(shè)閾值且所述轉(zhuǎn)發(fā)用戶的粉絲數(shù)量大于第二預(yù)設(shè)閾值時(shí),確定所述文本信息為第二文本信息,為所述微博文章對(duì)應(yīng)的所述文本信息設(shè)置第二標(biāo)簽。
7.根據(jù)權(quán)利要求1所述的分析及視圖展示方法,其特征在于,所述方法還包括:
將所述多個(gè)可視化圖與所述預(yù)警圖上傳至區(qū)塊鏈中。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳壹賬通智能科技有限公司,未經(jīng)深圳壹賬通智能科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011035414.X/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。





