[發明專利]基于立場檢測的推選預測分析方法在審
| 申請號: | 202010937515.X | 申請日: | 2020-09-08 |
| 公開(公告)號: | CN113379095A | 公開(公告)日: | 2021-09-10 |
| 發明(設計)人: | 李文法;陳瑩瑩;梁煜博 | 申請(專利權)人: | 北京聯合大學 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06F16/35;G06N3/04;G06N3/08 |
| 代理公司: | 北京思海天達知識產權代理有限公司 11203 | 代理人: | 劉萍 |
| 地址: | 100101 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 立場 檢測 推選 預測 分析 方法 | ||
1.一種基于立場檢測的推選預測分析方法,其特征在于包括如下步驟:
步驟一,人工標注的定義推選相關關鍵詞;
步驟二,再使用爬蟲技術,爬取訓練時間段產生的所有相關文本;
步驟三,之后將這些文本抽樣標記,并使用標記數據完成立場檢測分類器的訓練;
步驟四,使用爬蟲技術,爬取預測時間段產生的所有相關文本;
步驟五,再使用通過訓練數據訓練的立場檢測分類器,完成文本的立場檢測;
步驟六,統計結果,得到表達投票傾向的指標,從而完成推選預測,即使用選區作為單位,將該選區候選人中某個指標最大的候選人作為預測結果,X為不同的指標。
2.根據權利要求1所述的基于立場檢測的推選預測分析方法,其特征在于,所述步驟二中
從時間上分為兩段:一段是訓練時間段,另一段是預測時間段;訓練時間段規定了模型的訓練階段使用的數據產生的時間;預測時間段規定了立場檢測與推選預測階段使用的數據產生的時間。
3.根據權利要求1所述的基于立場檢測的推選預測分析方法,其特征在于,所述步驟三中本文使用“候選人”代替候選人相關推文中的候選人名字。
4.根據權利要求1所述的基于立場檢測的推選預測分析方法,其特征在于,所述步驟三中將不同標簽的數據按照相等比例抽取,生成三個標簽數量相等的訓練數據集。
5.根據權利要求1所述的基于立場檢測的推選預測分析方法,其特征在于,本階段就會結合關鍵詞,通過爬蟲技術檢索所有在訓練時間段內的包含檢索詞的所有twitter文本;將推文作為立場檢測的文本內容,將文本中包含的候選人姓名作為目標主題。
6.根據權利要求1所述的基于立場檢測的推選預測分析方法,其特征在于,使用基于雙通道CNN-GRU融合網絡的微博文本立場檢測模型,對訓練數據進行停用詞的刪除、分詞與詞向量表示,最后用于訓練本立場檢測模型,生成立場檢測分類器。
7.根據權利要求1所述的基于立場檢測的推選預測分析方法,其特征在于,以關鍵詞為單位,通過對立場檢測結果的統計,得到可以表達投票人對候選人的投票傾向的結果。
8.根據權利要求1所述的基于立場檢測的推選預測分析方法,其特征在于,k表示關鍵詞,即候選人姓名;在預測時間段內得到的文本總數(V_Sk)表示為:
V_Sk=count(Search_textk)。
9.根據權利要求1所述的基于立場檢測的推選預測分析方法,其特征在于,當k詞被認為是支持目標主題的推文;得到的支持文本總數(V_Fk)表示為:
V_Fk=count(FAVOR_textk)
當k詞被認為是不支持目標主題的推文;得到的不支持文本總數(V_Ak)表示為:
V_Ak=count(AGAINST_textk)
當k詞被認為是無立場目標主題的推文;得到的無立場文本總數(V_Nk)表示為:
V_Nk=count(NONE_textk)。
10.根據權利要求1所述的基于立場檢測的推選預測分析方法,其特征在于,所述步驟五中,以候選人為單位計算,在預測時間段內,候選人的所有相關推文中表達支持的推文占比(R_Fk)、表達不支持的推文占比(R_Ak)與表達無立場的推文占比(R_Nk)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京聯合大學,未經北京聯合大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010937515.X/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:半導體裝置
- 下一篇:圖像擷取設備和距離測量裝置
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





