[發(fā)明專利]一種用于分析社交網(wǎng)絡(luò)信息的高質(zhì)量信息獲取方法和系統(tǒng)在審
| 申請?zhí)枺?/td> | 202010713830.4 | 申請日: | 2020-07-22 |
| 公開(公告)號: | CN111858674A | 公開(公告)日: | 2020-10-30 |
| 發(fā)明(設(shè)計)人: | 于霄 | 申請(專利權(quán))人: | 北京宏博知微科技有限公司 |
| 主分類號: | G06F16/2455 | 分類號: | G06F16/2455;G06F16/9536;G06Q50/00 |
| 代理公司: | 北京卓唐知識產(chǎn)權(quán)代理有限公司 11541 | 代理人: | 卜榮麗 |
| 地址: | 100000 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 用于 分析 社交 網(wǎng)絡(luò) 信息 質(zhì)量 獲取 方法 系統(tǒng) | ||
本申請公開了一種用于分析社交網(wǎng)絡(luò)信息的高質(zhì)量信息獲取方法和系統(tǒng),方法,包括如下步驟:S1、預設(shè)數(shù)據(jù)流閥值和單信息重復閥值;S2、根據(jù)數(shù)據(jù)流閥值和單信息重復閥值,獲取社交網(wǎng)絡(luò)信息數(shù)據(jù)流;S3、對所獲取的社交網(wǎng)絡(luò)信息數(shù)據(jù)流進行特征量提取,并生成特征量集合;S4、根據(jù)特征量集合,計算獲取社交網(wǎng)絡(luò)信息數(shù)據(jù)流的質(zhì)量評分、重復規(guī)避評分和獨立評分;S5、根據(jù)質(zhì)量評分、重復規(guī)避評分和獨立評分,計算獲取社交網(wǎng)絡(luò)信息數(shù)據(jù)流的有效性評分,獲取高質(zhì)量的社交網(wǎng)絡(luò)信息數(shù)據(jù)流。本發(fā)明提出了基于有效性過濾的真實信息提取方法,采用基于線性的計算方式對數(shù)據(jù)進行快速計算,能夠過濾低質(zhì)量信息,真實有效的信息以供后續(xù)分析使用。
技術(shù)領(lǐng)域
本申請涉及互聯(lián)化信息處理技術(shù)領(lǐng)域,尤其涉及一種用于分析社交網(wǎng)絡(luò)信息的高質(zhì)量信息獲取方法和系統(tǒng)。
背景技術(shù)
隨著信息技術(shù)的發(fā)展,社交網(wǎng)絡(luò)作為一種重要高效的信息傳遞平臺,參與其中的人員越來越多。通過這個平臺,個人可在網(wǎng)絡(luò)中拓展人脈、獲取信息,而企業(yè)主要關(guān)注點在于找到消費者,并能分析消費者,了解消費者,與消費者達到最簡潔快速的溝通。企業(yè)通過數(shù)據(jù)分析找到消費者所在的圈子,傾聽這個圈子的聲音,并通過意見領(lǐng)袖讓企業(yè)想傳達的信息進一步擴大,輻射整個圈子,最終從而吸納更多的忠實消費者。
企業(yè)進行信息評估時,主要基于社交網(wǎng)絡(luò)上的各種轉(zhuǎn)發(fā)和評論信息,這些對企業(yè)的價值是巨大的,對這些數(shù)據(jù)加以分析,可助于改進現(xiàn)有產(chǎn)品及更好的定位未來的產(chǎn)品走向。然而對社交網(wǎng)絡(luò)的信息分析存在固有的難題,首先是社交網(wǎng)絡(luò)中充斥著虛假信息與低質(zhì)量信息,統(tǒng)一的對所有信息進行觀測理解,無法反映真實的問題;其次由于參與的人員眾多,導致信息是無界的,信息可以在網(wǎng)絡(luò)中無限擴展,甚至最后影響到現(xiàn)實,如此海量的原始信息難以完全理解和有效抽取,最終用以輔助決策。如何去找到這些信息點位,用以擴大品牌正面聲量、減少并消除負面聲量成為企業(yè)在社會化營銷中制勝的關(guān)鍵,而實際可用的社交網(wǎng)絡(luò)有效信息的提取方法能給企業(yè)帶來確實的幫助。
發(fā)明內(nèi)容
本申請的主要目的在于提供一種用于分析社交網(wǎng)絡(luò)信息的高質(zhì)量信息獲取方法和系統(tǒng),以實現(xiàn)社交網(wǎng)絡(luò)信息地有效過濾和提取。
為了實現(xiàn)上述目的,本申請?zhí)峁┝巳缦录夹g(shù):
本發(fā)明第一方面在于提出一種用于分析社交網(wǎng)絡(luò)信息的高質(zhì)量信息獲取方法,包括如下步驟:
S1、預設(shè)數(shù)據(jù)流閥值和單信息重復閥值;
S2、根據(jù)數(shù)據(jù)流閥值和單信息重復閥值,獲取社交網(wǎng)絡(luò)信息數(shù)據(jù)流;
S3、對所獲取的社交網(wǎng)絡(luò)信息數(shù)據(jù)流進行特征量提取,并生成特征量集合;
S4、根據(jù)特征量集合,計算獲取社交網(wǎng)絡(luò)信息數(shù)據(jù)流的質(zhì)量評分、重復規(guī)避評分和獨立評分;
S5、根據(jù)質(zhì)量評分、重復規(guī)避評分和獨立評分,計算獲取社交網(wǎng)絡(luò)信息數(shù)據(jù)流的有效性評分,獲取高質(zhì)量的社交網(wǎng)絡(luò)信息數(shù)據(jù)流。
進一步地,所述預設(shè)數(shù)據(jù)流閥值和單信息重復閥值,具體為:
設(shè)定數(shù)據(jù)流閥值G,截取超過G值的社交網(wǎng)絡(luò)信息數(shù)據(jù)流;
設(shè)定單信息重復閥值β,過濾剔除超過β值的單信息重復數(shù)據(jù)流。
進一步地,所述根據(jù)數(shù)據(jù)流閥值和單信息重復閥值,獲取社交網(wǎng)絡(luò)信息數(shù)據(jù)流,具體為:
截取超過G值的社交網(wǎng)絡(luò)信息數(shù)據(jù)流,根據(jù)所設(shè)定單信息重復閥值β,過濾剔除超過β值的重復數(shù)據(jù)流,留下滿足單信息狀態(tài)的社交網(wǎng)絡(luò)信息數(shù)據(jù)流;
其中,G范圍為大于或等于800的整數(shù),β范圍為0-0.005;
獲取G個關(guān)于社交網(wǎng)絡(luò)信息的轉(zhuǎn)發(fā)及評論的記錄信息,記錄為Pk;
Pk表示第k個社交網(wǎng)絡(luò)信息的轉(zhuǎn)發(fā)及評論的記錄信息。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京宏博知微科技有限公司,未經(jīng)北京宏博知微科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010713830.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 社交網(wǎng)絡(luò)裝置成員資格和應用
- 一種社交對象搜索方法及裝置
- 針對嵌入式應用上下文中的搜索的查詢意圖表達
- 一種關(guān)鍵社交信息的確定方法及裝置
- 社交網(wǎng)絡(luò)數(shù)據(jù)的可視化方法、裝置、設(shè)備及存儲介質(zhì)
- 動態(tài)社交圈確定方法、裝置、設(shè)備及存儲介質(zhì)
- 控制社交分享信息在社交空間的呈現(xiàn)狀態(tài)的方法與設(shè)備
- 社交角色管理方法、計算機設(shè)備及存儲介質(zhì)
- 基于社交關(guān)系的社交屬性數(shù)據(jù)確定方法、裝置及設(shè)備
- 一種社交賬戶推薦方法、裝置、電子設(shè)備和存儲介質(zhì)
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應系統(tǒng)和方法及應用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲介質(zhì)及移動終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復網(wǎng)絡(luò)地址自動恢復的方法、網(wǎng)絡(luò)設(shè)備及其存儲介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓練方法、裝置及存儲介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置





