[發明專利]一種基于信訪信件概況的信件要素自動提取方法在審
| 申請號: | 201910976039.X | 申請日: | 2019-10-15 |
| 公開(公告)號: | CN110717045A | 公開(公告)日: | 2020-01-21 |
| 發明(設計)人: | 謝磊;張麗;焦安琪;何義民;李飛;何志成;曹珊;劉世旭 | 申請(專利權)人: | 同方知網(北京)技術有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/31;G06F16/34;G06N3/04 |
| 代理公司: | 11340 北京天奇智新知識產權代理有限公司 | 代理人: | 陳新勝 |
| 地址: | 100084 北京市海淀區清華園清華*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 信件 基本要素 自動提取 中文自然語言處理 智能化處理 機器學習 文本生成 文本挖掘 真實狀態 自動生成 大數據 碎片化 語句 文本 情緒 分析 幫助 | ||
本發明公開了一種基于信訪信件概況的信件要素自動提取方法,包括:信訪信件要素的自動生成,利用CNLP中文自然語言處理、大數據、機器學習將大篇幅的信訪文本生成為簡短的信訪概要;信訪信件要素的自動提取,利用文本挖掘技術將文本進行碎片化處理,根據要求提取信訪基本要素。智能化處理信訪信件,客觀科學提取信訪信件的基本要素和概要,使信訪處理科學高效,能夠將信訪信件中信訪人語句和用詞表達的情緒進行分析,幫助了解信訪人的真實狀態。
技術領域
本發明涉及文本挖掘和計算機信息處理技術領域,尤其涉及知識元抽取技術、數據挖掘分析技術、自然語言處理技術、碎片標引和索引技術、機器學習技術的要素自動提取方法。
背景技術
隨著信訪渠道的多樣化,信訪工作變的非常復雜龐大,人工進行比對、分析、歸類、整理傳統信訪接待方式明顯力不從心,而傳統的文本處理完全依托于本文的特征,對于文本的關聯分析、趨勢預測等文本挖掘的技術應用相對不足;同時本文挖掘技術本身也有局限性,受語料庫、挖掘技術和計算機技術等的影響,有時即使正確的運用了文本挖掘的技術,也往往得不到預期的效果;對于信訪類的文本處理缺乏情緒指標,不能夠了解信訪件的情緒狀態。
發明內容
為解決上述技術問題,本發明的目的是提供一種基于信訪信件概況的信件要素自動提取方法。
本發明的目的通過以下的技術方案來實現:
一種基于信訪信件概況的信件要素自動提取方法,包括:
信訪信件要素的自動生成,利用CNLP中文自然語言處理、大數據、機器學習將大篇幅的信訪文本生成為簡短的信訪概要;
信訪信件要素的自動提取,利用文本挖掘技術將文本進行碎片化處理,根據要求提取信訪基本要素。
與現有技術相比,本發明的一個或多個實施例可以具有如下優點:
智能化處理信訪信件,客觀科學提取信訪信件的基本要素和概要,使信訪處理科學高效,能夠對信訪信件中信訪人語句和用詞表達的情緒進行分析,幫助了解信訪人的真實狀態。
附圖說明
圖1是基于信訪信件概況的信件要素自動提取方法圖;
圖2是基于信訪信件概況要素自動提取方法的邏輯圖。
具體實施方式
為使本發明的目的、技術方案和優點更加清楚,下面將結合實施例及附圖對本發明作進一步詳細的描述。
如圖1所示,基于信訪信件概況的信件要素自動提取方法,包括:
信訪信件要素的自動生成,利用CNLP中文自然語言處理、大數據、機器學習等技術手段,對信訪信件中信訪人語句和用詞表達的情緒進行分析,量化打分,利用人工智能剔除主觀偏見,歸納信訪數據的客觀規律,從而將長篇信訪信件進行自動文摘,生成簡潔核心內容;
信訪信件要素自動提取,利用文本挖掘和先進的CNLP自然語言處理模型中的CNN(卷積神經網絡)、RNN(循環神經網絡)、LSTM(長短時記憶模型)進行知識關聯與數據二次智能分類存儲,對信訪信件中信訪人語句和用詞表達的情緒進行分析,量化打分,進而對長篇信訪信件進行碎片化處理,即時完成信件命名實體識別、自動摘要提取、核心訴求提取、在線分析歸類,幫助構建新型信訪管理體系;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于同方知網(北京)技術有限公司,未經同方知網(北京)技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910976039.X/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種研報正文的文本分類方法
- 下一篇:一種基于文本數據的資料管理系統及方法





