[發明專利]基于LDA和向量空間模型的公共政策參與度評估方法及系統在審
| 申請號: | 202210144015.X | 申請日: | 2022-02-17 |
| 公開(公告)號: | CN114528819A | 公開(公告)日: | 2022-05-24 |
| 發明(設計)人: | 杜登偉;杜登斌;杜樂;杜小軍 | 申請(專利權)人: | 武漢東湖大數據交易中心股份有限公司 |
| 主分類號: | G06F40/194 | 分類號: | G06F40/194;G06F40/279;G06F40/30;G06F17/16;G06Q10/06;G06Q50/26 |
| 代理公司: | 武漢紅觀專利代理事務所(普通合伙) 42247 | 代理人: | 趙志汝 |
| 地址: | 430000 湖北省武漢市東湖新技術開*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 lda 向量 空間 模型 公共政策 參與 評估 方法 系統 | ||
本發明提出了一種基于LDA和向量空間模型的公共政策參與度評估方法及系統,其方法包括:獲取目標公共政策文檔和目標動態數據;采用TF?IDF算法分別對目標公共政策文檔和目標動態數據進行分詞處理,得到文檔特征分詞集合和數據特征分詞集合;通過LDA模型分別提取目標公共政策文檔和目標動態數據中隱含的語義信息,得到文檔?數據矩陣;基于文檔特征分詞集合和數據特征分詞集合構建向量空間模型,計算出目標公共政策文檔與目標動態數據之間的相似度,得到相似度矩陣;對文檔?數據矩陣和相似度矩陣進行線性加權處理。本發明能夠對公共政策中的公民參與度進行有效評估,同時也解決了數據稀疏和語義丟失的問題,提高了評估的準確性和有效性。
技術領域
本發明涉及人工智能技術領域,尤其是涉及一種基于LDA和向量空間模型的公共政策參與度評估方法及系統。
背景技術
公共政策評估是指評估主體根據一定的標準和程序,通過科學的評估工具與評估方法對于政策的必要性、可行性、成本收益以及實施效果做出的綜合性判斷與評價,其目的在于降低決策風險,提升政策實施效率,對不合理或不完善的政策立項與實施過程適時進行調整與改進,以及為新政策的制定建立理論依據和經驗比對,科學的評估程序與評估方法是開展公共政策評估工作的技術保障。公共政策評估的過程都離不開公民的參與,公民參與到公共政策的制度和執行過程中,可以加強公民對公共政策、國家政策和社會的發展的認知和理解,同時還可以為公共政策的落實提供保障,因此,對公共政策中的公民參與度進行評估顯得尤為重要。
目前,利用傳統數據挖掘中的文本聚類方法對網絡文本進行話題檢測仍是主流,也有很多的相關市場產品問世,但是,傳統的文本聚類算法在數據的降維和語義表達方面的表現并不理想,從而影響了評估結果的準確性和有效性。
發明內容
有鑒于此,本申請提出了一種基于LDA和向量空間模型的公共政策參與度評估方法及系統,有效解決了傳統的文本聚類方法存在的數據稀疏和語義丟失問題,能夠對公共政策中的公民參與度進行有效評估。
本發明的技術方案是這樣實現的:
本發明提出了一種基于LDA和向量空間模型的公共政策參與度評估方法,所述方法包括:
S1,獲取目標公共政策文檔,同時獲取目標公共政策文檔發布后預設階段內的動態數據,作為目標動態數據;
S2,采用TF-IDF算法分別對所述目標公共政策文檔和目標動態數據進行分詞處理,得到文檔特征分詞集合和數據特征分詞集合;
S3,建立LDA模型,通過LDA模型分別提取目標公共政策文檔和目標動態數據中隱含的語義信息,得到文檔-數據矩陣;
S4,基于文檔特征分詞集合和數據特征分詞集合構建向量空間模型,計算出目標公共政策文檔與目標動態數據之間的相似度,得到相似度矩陣;
S5,對文檔-數據矩陣和相似度矩陣進行線性加權處理,得到可以映射預設階段內公民對公共政策的關注度的組合矩陣。
在以上技術方案的基礎上,優選的,步驟S2具體包括:
所述TF-IDF算法為經過改進的特征權重算法,其計算公式為:
其中,W(t,d)表示t在d中的權重,tf(t,d)為t在d中出現的頻次,d為文本語料庫C中的一個文檔,t為文檔d中的一個詞,C={c1,c2,…,cm},ci∈C,m為文本語料庫的類別數,G表示文本語料庫中文檔的總數,nt為文本語料庫中包含t的文本數,W(wk,ci)表示詞語wk關于類別ci的類別權重,wk表示第k個詞, ci表示第i類文章;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢東湖大數據交易中心股份有限公司,未經武漢東湖大數據交易中心股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210144015.X/2.html,轉載請聲明來源鉆瓜專利網。





