[發明專利]一種基于SVM的特定文本大數據分析方法及系統在審
| 申請號: | 202210628092.2 | 申請日: | 2022-06-06 |
| 公開(公告)號: | CN115525758A | 公開(公告)日: | 2022-12-27 |
| 發明(設計)人: | 計哲;石瑾;李鵬;孫曉晨;萬辛;寧珊;劉發強;孫旭東;倪善金;齊帥;許高尚;齊朋飛 | 申請(專利權)人: | 國家計算機網絡與信息安全管理中心 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06N20/10 |
| 代理公司: | 天津璽名律師事務所 12263 | 代理人: | 楊琳 |
| 地址: | 100000*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 svm 特定 文本 數據 分析 方法 系統 | ||
本發明涉及一種基于SVM的特定文本大數據分析方法及系統,所述一種基于SVM的特定文本大數據分析方法包括:利用歷史特定文本大數據得到歷史特定文本大數據特征;利用所述歷史特定文本大數據特征獲取歷史特定文本大數據分析結果,采用SVM的大數據分析系統的技術,全面提高特定文本的分類的準確性和覆蓋率,通過在海量數據中實現對特定內容的精準分類,大大提高了特定內容分類的及時性和準確性,從而提高了系統層面對特定內容處理的流轉環節,大大提高了應用系統的處理能力。
技術領域
本發明涉及識別文本內容分類領域,具體涉及一種基于SVM的特定文本大數據分析方法及系統。
背景技術
大多數機器學習的目標是為特定場景開發預測引擎。一個算法將接收到一個域的信息(例如,一個人過去觀看過的電影),權衡輸入做出一個有用的預測(未來想看的不同電影的概率)。通過計算機學習的能力,通過優化任務衡量變量的可用數據,做出算法,來對未來做出準確的預測。算法最初接收其輸出是已知的示例,此時要注意其預測和正確輸出之間的差異,并且調諧輸入的權重以提高其預測的準確性,直到它們被優化。因此,機器學習算法的定義特征是,它們的預測的質量隨著經驗而改進。通過機器學習算法SVM技術結合自研特定樣本集數據,可以在特定內容中快速識別特定內容分類,從而達到快速預警目的。
發明內容
針對現有技術的不足,本發明提供了一種基于SVM的特定文本大數據分析方法,通過對歷史數據的處理,并根據實際情況對機器算法核函數的改進,提升了模型的識別準確率。
為實現上述目的,本發明提供了一種基于SVM的特定文本大數據分析方法,包括:
利用歷史特定文本大數據得到歷史特定文本大數據特征;
利用所述歷史特定文本大數據特征獲取歷史特定文本大數據分析結果。
優選的,所述利用歷史特定文本大數據得到歷史特定文本大數據特征包括:
判斷所述歷史特定文本大數據是否存在非結構化數據,若是,則對所述歷史特定文本大數據的非結構化數據轉化為結構化數據得到歷史特定文本基礎大數據,利用所述歷史特定文本基礎大數據獲取歷史特定文本大數據特征,否則,利用所述歷史特定文本大數據獲取歷史特定文本大數據特征。
優選的,利用所述歷史特定文本大數據特征獲取歷史特定文本大數據分析結果包括:
利用所述歷史特定文本大數據帶入預先訓練的歷史特定文本大數據分析模型得到歷史特定文本大數據分析結果。
進一步的,所述歷史特定文本大數據分析模型的訓練包括:
利用所述歷史特定文本大數據特征劃分訓練集與測試集;
以訓練集為輸入,以訓練集對應的歷史特定文本大數據特征分析結果為輸出,基于支持向量機進行訓練得到歷史特定文本大數據基礎分析模型;
利用所述歷史特定文本大數據基礎分析模型根據測試集進行性能提升處理得到歷史特定文本大數據分析模型。
進一步的,利用所述歷史特定文本大數據基礎分析模型根據測試集進行性能提升處理得到歷史特定文本大數據分析模型包括:
將所述測試集帶入歷史特定文本大數據基礎分析模型得到歷史特定文本大數據基礎分析測試結果;
當所述歷史特定文本大數據基礎分析測試結果達到輸出判斷閾值時,將歷史特定文本大數據基礎分析模型作為歷史特定文本大數據分析模型輸出;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國家計算機網絡與信息安全管理中心,未經國家計算機網絡與信息安全管理中心許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210628092.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種農業智能監控系統
- 下一篇:一種物聯網采集器通用數據配置系統





