[發明專利]論壇熱帖歸檔管理方法、裝置、計算機設備和存儲介質在審
| 申請號: | 201811637227.1 | 申請日: | 2018-12-29 |
| 公開(公告)號: | CN109741200A | 公開(公告)日: | 2019-05-10 |
| 發明(設計)人: | 鄭巨雙 | 申請(專利權)人: | 深圳英飛拓智能技術有限公司 |
| 主分類號: | G06Q50/00 | 分類號: | G06Q50/00;G06F16/951;G06F16/9535;G06F16/335 |
| 代理公司: | 深圳市精英專利事務所 44242 | 代理人: | 馮筠 |
| 地址: | 518000 廣東省深圳市龍華區觀湖街道*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 帖子 歸檔管理 論壇熱帖 歸檔 計算機設備 存儲介質 歸檔信息 獲取內容 論壇帖子 數據分析 信息統計 熱貼 論壇 申請 管理 | ||
1.一種論壇熱帖歸檔管理方法,所述方法包括:
獲取論壇熱帖歸檔管理請求;
根據所述論壇熱帖歸檔管理請求,獲取對應的論壇列表;
根據所述論壇列表,獲取內容有變化的帖子列表;
判斷所述帖子列表中的帖子是否符合熱帖條件;
若所述帖子符合熱帖條件則判斷所述帖子是否存在于歸檔的熱帖中;
若所述帖子已經歸檔,則按照所述帖子的歸檔信息獲取上次爬取的位置并對所述帖子進行信息統計以及管理。
2.根據權利要求1所述的論壇熱帖歸檔管理方法,其特征在于,所述判斷所述帖子列表中的帖子是否符合熱帖條件的步驟還包括:
判斷所述帖子是否存在于歸檔的熱帖中;
若存在于歸檔的熱帖中,則根據上次爬取的位置繼續爬取所述帖子的內容;
若不存在于歸檔的熱帖中,則從頭開始爬取所述帖子的內容;
爬取所述帖子的內容包含:帖子信息和統計信息;
其中,所述帖子信息包括:訪問量、標題、作者、發表時間、最近更新時間、來源網站以及每個樓層的信息;
所述統計信息包括:回復數量、評價數量、參與回復的人員、人員回復的次數、點贊最多的樓層、評論最多樓層以及最后樓層的信息。
3.根據權利要求2所述的論壇熱帖歸檔管理方法,其特征在于,所述判斷所述帖子是否存在于歸檔的熱帖中的步驟還包括:
獲取所述帖子的作者、發表時間、標題信息、訪問量、來源網站以及回帖數,將所述帖子的信息與歸檔熱帖的信息進行比對;
若帖子的作者、發表時間、標題信息以及來源網站完全相同,且訪問量和評價數大于等于所述歸檔熱帖,則認定為同一帖;
獲取所述歸檔熱帖的信息,根據上次歸檔的最后位置,查找到對應的樓層,繼續獲取后面的樓層信息,更新所述歸檔熱帖的相關信息。
4.根據權利要求3所述的論壇熱帖歸檔管理方法,其特征在于,在所述獲取所述帖子的作者、發表時間、標題信息、訪問量、來源網站以及回帖數,將所述帖子的信息與歸檔熱帖的信息進行比對的步驟之后還包括:
若帖子的作者、標題信息以及來源網站相同,而發表時間不同,則認為為重復帖;
判斷所述歸檔熱帖最后樓層的時間是否在當前帖子最近更新的時間之前;
如是則更新所述歸檔熱帖的相關信息,否則不進行處理。
5.根據權利要求3所述的論壇熱帖歸檔管理方法,其特征在于,在所述獲取所述帖子的作者、發表時間、標題信息、訪問量、來源網站以及回帖數,將所述帖子的信息與歸檔熱帖的信息進行比對的步驟之后還包括:
若帖子的作者或者標題信息不同則對所述帖子進行重新歸檔。
6.根據權利要求1-5任一項所述的論壇熱帖歸檔管理方法,其特征在于,所述方法還包括:
對所述帖子的熱度進行評分;
定期整理已歸檔的熱帖,根據所述帖子熱度的評分將熱度降低的熱帖從歸檔的熱帖列表中刪除。
7.根據權利要求6所述的論壇熱帖歸檔管理方法,其特征在于,所述對所述帖子的熱度進行評分的步驟包括:
對于沒有歸檔的帖子,獲取所述帖子的訪問量、發帖時間和回帖數,并計算所述帖子的初始熱度;順序獲取所述帖子中所有樓層信息,根據樓層的評價數和點贊數對熱度進行修正;判斷當前樓層和上一個樓層是否隔天,若有則按照天數對熱度進行修正;
對于已經歸檔的熱帖,獲取所述熱帖的新的訪問量以及回復量,根據所述新的訪問量以及回復量對所述已經歸檔的熱帖的熱度進行修正。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳英飛拓智能技術有限公司,未經深圳英飛拓智能技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811637227.1/1.html,轉載請聲明來源鉆瓜專利網。





