[發明專利]一種基于特征的非正式短文本情報分析研究方法在審
| 申請號: | 202210068979.0 | 申請日: | 2022-01-20 |
| 公開(公告)號: | CN114429184A | 公開(公告)日: | 2022-05-03 |
| 發明(設計)人: | 洪芳華 | 申請(專利權)人: | 洪芳華 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06F40/253;G06F16/38;G06F16/35 |
| 代理公司: | 北京智行陽光知識產權代理事務所(普通合伙) 11738 | 代理人: | 魏毅凡 |
| 地址: | 230031 安徽省合肥*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 特征 非正式 文本 情報 分析研究 方法 | ||
本發明涉及情報分析研究技術領域,且公開了一種基于特征的非正式短文本情報分析研究方法,所述原始數據源的輸出端與數據中心電性連接,所述數據中心的輸出端與特征提取模塊電性連接,所述特征提取模塊的輸出端與信息獲取模塊電性連接,所述信息獲取模塊的輸出端與情報分類檢索模塊電性連接,所述情報分類檢索模塊的輸出端與情感分析研究模塊電性連。通過段落抽取分散模塊、短文本抽取模塊和詞條抽取模塊對文本數據中的短文本進行抽取和提取,獲得的段落數據、短文本數據和詞條數據進入信息獲取模塊中,通過短文本辨別模塊和詞條辨別模塊對其通過情感的不同通過分類模塊進行分類,快速地對大量文本數據中的短文本和詞條進行抽取編號。
技術領域
本發明涉及情報分析研究技術領域,具體為一種基于特征的非正式短文本情報分析研究方法。
背景技術
文本分析研究就是將文本所表達的情感信息量化,研究一段文本所表達的積極的、消極的或者中立的極性,來分析文本的情感傾向性,近年來出現了大量關于文本情感分析的研究,一般可根據性質分為兩類,一是基于有監督的情感分析研究,二是基于無監督的情感分析研究,另外也存在一些半監督的情感分析研究,但是現有的文本情報分析研究方法仍然存在一些不足之處,比如現有的本情報分析研究方法對短文本的陳述情感極性判別能力較弱,整體情感元組的提取效率不高。
發明內容
(一)解決的技術問題
針對現有技術的不足,本發明提供了一種基于特征的非正式短文本情報分析研究方法,具備可以快速地對大量文本數據中的短文本和詞條進行抽取編號,同時根據對比文獻通過情感的不同對其進行分類,節約了材料收集的時間,便于后續的分析研究和可以根據需要快速對相關詞條進行檢索分析,提高了工作效率等優點,解決了現有的本情報分析研究方法對短文本的陳述情感極性判別能力較弱,整體情感元組的提取效率不高的問題。
(二)技術方案
為實現上述目的,本發明提供如下技術方案:一種基于特征的非正式短文本情報分析研究方法,包括原始數據源,所述原始數據源的輸出端與數據中心電性連接,所述數據中心的輸出端與特征提取模塊電性連接,所述特征提取模塊的輸出端與信息獲取模塊電性連接,所述信息獲取模塊的輸出端與情報分類檢索模塊電性連接,所述情報分類檢索模塊的輸出端與情感分析研究模塊電性連接。
優選的,所述特征提取模塊包括段落抽取分散模塊、短文本抽取模塊和詞條抽取模塊,所述段落抽取分散模塊的輸出端與短文本抽取電性連接,所述短文本抽取模塊的輸出端與詞條抽取模塊電性連。
優選的,所述信息獲取模塊包括專題對比文獻、短文本辨別模塊和詞條辨別模塊,所述專題對比文獻的輸出端分別與短文本辨別模塊和詞條辨別模塊電性連接。
優選的,所述情報分類檢索模塊包括文本情報數據庫、人工檢索模塊、分類模塊和智能檢索模塊,所述分類模塊的輸出端與文本情報數據庫電性連接,所述文本情報數據庫的輸出端本別與人工檢索模塊電性連接和智能檢測模塊電性連接。
優選的,所述情感分析講究模塊包括特征分析模塊、情報分析模塊和情報研究模塊,所述特征分析模塊的輸出端與情報分析模塊電性連接,所述情報分析模塊的輸出端與情報研究模塊電性連接。
優選的,所述數據中心的輸出端與段落抽取分散模塊電性連接。
優選的,所述短文本辨別模塊的輸入端與短文本抽取模塊電性連接,所述詞條辨別模塊的輸入端與詞條抽取模塊電性連接。
優選的,所述分類模塊的輸出端與詞條辨別模塊電性連接,所述人工檢索模塊和智能檢索模塊的輸出端均與特征分析模塊電性連接。
優選的,根據上述的一種基于特征的非正式短文本情報分析研究方法,包括以下步驟:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于洪芳華,未經洪芳華許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210068979.0/2.html,轉載請聲明來源鉆瓜專利網。





