[發明專利]一種基于多種自然語言處理技術的無人駕駛新聞分析方法在審
| 申請號: | 202211389089.6 | 申請日: | 2022-11-08 |
| 公開(公告)號: | CN115617970A | 公開(公告)日: | 2023-01-17 |
| 發明(設計)人: | 白羽;黃啟迪 | 申請(專利權)人: | 合肥工業大學 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/35;G06F16/951;G06F16/9535;G06F40/30;G06F40/295;G06N3/04;G06N3/08 |
| 代理公司: | 合肥中谷知識產權代理事務所(普通合伙) 34146 | 代理人: | 袁錦波 |
| 地址: | 230000 *** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 多種 自然語言 處理 技術 無人駕駛 新聞 分析 方法 | ||
本發明涉及一種基于多種自然語言處理技術的無人駕駛新聞分析方法,所述基于多種自然語言處理技術的無人駕駛新聞分析方法包括以下步驟:針對無人駕駛新聞,利用網絡爬蟲技術,爬取網絡媒體新聞;數據預處理;主題數量確定和LDA模型;Word2vec文本向量化和LSTM建模訓練;新聞分類和計算每日新聞情緒值;主題?情緒可視化分析。本發明通過手動標注消極訓練集和積極態度數據集,提高LSTM模型的準確率,計算的情緒值準確率高;通過LDA模型更好地區分新聞報道關于無人駕駛技術的主題,并計算出每類主題下新聞情緒值,為媒體機構、政策制定者、機構投資者與監管者帶來及時反饋,具有一定的經濟和社會效益。
技術領域
本發明屬于新聞分析技術領域,尤其涉及一種基于多種自然語言處理技術的無人駕駛新聞分析方法。
背景技術
在計算機技術和大數據技術的推動下,越來越多的研究者開始從媒體新聞、公司報道等方面提取出文本情緒信息,相關研究仍然處于快速發展之中。與之相應的,計算機科學領域中的大數據和人工智能技術的快速發展也使得海量的信息挖掘和分析更加自動化、智能化,特別是自然語言處理領域中以機器學習、深度學習算法為代表的文本挖掘技術的日漸成熟,為上市公司和市場投資者提供了更有效及時的新聞媒體信息,但現有的方法效率和準確性有待提高。
目前,無人駕駛技術成為汽車產業發展新變量。鮮有針對無人駕駛相關新聞進行文本分析的研究,因此如何通過對無人駕駛新聞進行挖掘分析和文本處理以實現對無人駕駛技術提供重要數據支持,以幫助改善或提高相關政策文件制定,且如何使投資者針對新聞情緒做出理性決策,進而及時調整投資策略成為當下研究重點。
因此,有必要提供一種新的基于多種自然語言處理技術的無人駕駛新聞分析方法解決上述技術問題。
發明內容
本發明的目的就在于為了解決上述問題而提供一種基于多種自然語言處理技術的無人駕駛新聞分析方法。
本發明通過以下技術方案來實現上述目的:
一種基于多種自然語言處理技術的無人駕駛新聞分析方法,包括以下步驟:
S1:采集與無人駕駛相關的新聞文檔數據;
S2:對所述新聞文檔數據進行預處理,得到處理后新聞文檔數據;
S3:構建主題提取模型,通過所述主題提取模型對所述處理后新聞文檔數據進行主題提取和困惑度值計算,得到多個新聞主題數據和困惑度值,基于所述困惑度值大小選擇出最優的若干個新聞主題數據;
S4:構建情緒值計算模型,將所述新聞文檔數據輸入所述情緒值計算模型中進行訓練,得到訓練后情緒值計算模型;
S5:將所述處理后新聞文檔數據輸入所述訓練后情緒值計算模型,得到每條所述處理后新聞文檔數據的情緒值;
S6:基于最優的若干個新聞主題數據和每條所述處理后新聞文檔數據的情緒值制作出制作出每個不同的所述新聞主題數據下情緒值的視覺圖表,實現了新聞分析的目的。
作為本發明的進一步優化方案,所述步驟S1中采集與無人駕駛相關的新聞文檔數據的具體內容如下:通過網絡爬蟲技術,從互聯網中爬取含有與無人駕駛相關的關鍵詞的新聞文檔數據,所述關鍵詞包括無人駕駛、自動駕駛和智能駕駛。
作為本發明的進一步優化方案,所述步驟S2中對所述新聞文檔數據進行預處理,得到處理后新聞文檔數據,具體內容如下:對所述新聞文檔數據進行數據清洗,包括去除重復、無關的新聞文檔數據并對其中進行停用詞去除和分詞處理。
作為本發明的進一步優化方案,所述步驟S3中構建主題提取模型,通過所述主題提取模型對所述處理后新聞文檔數據進行主題提取和困惑度值計算,得到多個新聞主題數據和困惑度值,基于所述困惑度值選擇出最優的若干個新聞主題數據,具體內容如下:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于合肥工業大學,未經合肥工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211389089.6/2.html,轉載請聲明來源鉆瓜專利網。





