[發(fā)明專利]一種基于信訪信件概況的信件要素自動提取方法在審
| 申請?zhí)枺?/td> | 201910976039.X | 申請日: | 2019-10-15 |
| 公開(公告)號: | CN110717045A | 公開(公告)日: | 2020-01-21 |
| 發(fā)明(設(shè)計)人: | 謝磊;張麗;焦安琪;何義民;李飛;何志成;曹珊;劉世旭 | 申請(專利權(quán))人: | 同方知網(wǎng)(北京)技術(shù)有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/31;G06F16/34;G06N3/04 |
| 代理公司: | 11340 北京天奇智新知識產(chǎn)權(quán)代理有限公司 | 代理人: | 陳新勝 |
| 地址: | 100084 北京市海淀區(qū)清華園清華*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 信件 基本要素 自動提取 中文自然語言處理 智能化處理 機器學(xué)習(xí) 文本生成 文本挖掘 真實狀態(tài) 自動生成 大數(shù)據(jù) 碎片化 語句 文本 情緒 分析 幫助 | ||
本發(fā)明公開了一種基于信訪信件概況的信件要素自動提取方法,包括:信訪信件要素的自動生成,利用CNLP中文自然語言處理、大數(shù)據(jù)、機器學(xué)習(xí)將大篇幅的信訪文本生成為簡短的信訪概要;信訪信件要素的自動提取,利用文本挖掘技術(shù)將文本進行碎片化處理,根據(jù)要求提取信訪基本要素。智能化處理信訪信件,客觀科學(xué)提取信訪信件的基本要素和概要,使信訪處理科學(xué)高效,能夠?qū)⑿旁L信件中信訪人語句和用詞表達的情緒進行分析,幫助了解信訪人的真實狀態(tài)。
技術(shù)領(lǐng)域
本發(fā)明涉及文本挖掘和計算機信息處理技術(shù)領(lǐng)域,尤其涉及知識元抽取技術(shù)、數(shù)據(jù)挖掘分析技術(shù)、自然語言處理技術(shù)、碎片標(biāo)引和索引技術(shù)、機器學(xué)習(xí)技術(shù)的要素自動提取方法。
背景技術(shù)
隨著信訪渠道的多樣化,信訪工作變的非常復(fù)雜龐大,人工進行比對、分析、歸類、整理傳統(tǒng)信訪接待方式明顯力不從心,而傳統(tǒng)的文本處理完全依托于本文的特征,對于文本的關(guān)聯(lián)分析、趨勢預(yù)測等文本挖掘的技術(shù)應(yīng)用相對不足;同時本文挖掘技術(shù)本身也有局限性,受語料庫、挖掘技術(shù)和計算機技術(shù)等的影響,有時即使正確的運用了文本挖掘的技術(shù),也往往得不到預(yù)期的效果;對于信訪類的文本處理缺乏情緒指標(biāo),不能夠了解信訪件的情緒狀態(tài)。
發(fā)明內(nèi)容
為解決上述技術(shù)問題,本發(fā)明的目的是提供一種基于信訪信件概況的信件要素自動提取方法。
本發(fā)明的目的通過以下的技術(shù)方案來實現(xiàn):
一種基于信訪信件概況的信件要素自動提取方法,包括:
信訪信件要素的自動生成,利用CNLP中文自然語言處理、大數(shù)據(jù)、機器學(xué)習(xí)將大篇幅的信訪文本生成為簡短的信訪概要;
信訪信件要素的自動提取,利用文本挖掘技術(shù)將文本進行碎片化處理,根據(jù)要求提取信訪基本要素。
與現(xiàn)有技術(shù)相比,本發(fā)明的一個或多個實施例可以具有如下優(yōu)點:
智能化處理信訪信件,客觀科學(xué)提取信訪信件的基本要素和概要,使信訪處理科學(xué)高效,能夠?qū)π旁L信件中信訪人語句和用詞表達的情緒進行分析,幫助了解信訪人的真實狀態(tài)。
附圖說明
圖1是基于信訪信件概況的信件要素自動提取方法圖;
圖2是基于信訪信件概況要素自動提取方法的邏輯圖。
具體實施方式
為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合實施例及附圖對本發(fā)明作進一步詳細的描述。
如圖1所示,基于信訪信件概況的信件要素自動提取方法,包括:
信訪信件要素的自動生成,利用CNLP中文自然語言處理、大數(shù)據(jù)、機器學(xué)習(xí)等技術(shù)手段,對信訪信件中信訪人語句和用詞表達的情緒進行分析,量化打分,利用人工智能剔除主觀偏見,歸納信訪數(shù)據(jù)的客觀規(guī)律,從而將長篇信訪信件進行自動文摘,生成簡潔核心內(nèi)容;
信訪信件要素自動提取,利用文本挖掘和先進的CNLP自然語言處理模型中的CNN(卷積神經(jīng)網(wǎng)絡(luò))、RNN(循環(huán)神經(jīng)網(wǎng)絡(luò))、LSTM(長短時記憶模型)進行知識關(guān)聯(lián)與數(shù)據(jù)二次智能分類存儲,對信訪信件中信訪人語句和用詞表達的情緒進行分析,量化打分,進而對長篇信訪信件進行碎片化處理,即時完成信件命名實體識別、自動摘要提取、核心訴求提取、在線分析歸類,幫助構(gòu)建新型信訪管理體系;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于同方知網(wǎng)(北京)技術(shù)有限公司,未經(jīng)同方知網(wǎng)(北京)技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910976039.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 用于輸入中文字符的方法和設(shè)備
- 由點數(shù)據(jù)產(chǎn)生對地理對象的路線進行連續(xù)描述的幾何數(shù)據(jù)
- 一種信息系統(tǒng)風(fēng)險評估方法及裝置
- 一種跨線運行圖的數(shù)據(jù)存儲處理方法及裝置
- 一種實現(xiàn)企業(yè)基本要素自動連接的方法及其系統(tǒng)
- 一種自動生成企業(yè)基本要素連接組的方法及系統(tǒng)
- 企業(yè)基本要素連接組之間的自動交互方法和裝置
- 用于生成企業(yè)基本要素作用值的方法及其系統(tǒng)
- 一種基于QGIS的跨平臺矢量地圖要素符號渲染方法及裝置
- 低功耗智能物聯(lián)網(wǎng)關(guān)





