日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種基于機器學習的文本分類方法在審

專利信息
申請?zhí)枺?/td> 202011544023.0 申請日: 2020-12-24
公開(公告)號: CN113157912A 公開(公告)日: 2021-07-23
發(fā)明(設計)人: 劉建雄;陳敏 申請(專利權)人: 航天科工網絡信息發(fā)展有限公司
主分類號: G06F16/35 分類號: G06F16/35;G06F40/216;G06K9/62;G06N20/10
代理公司: 中國兵器工業(yè)集團公司專利中心 11011 代理人: 張然
地址: 100854 *** 國省代碼: 北京;11
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 基于 機器 學習 文本 分類 方法
【說明書】:

發(fā)明涉及一種基于機器學習的文本分類方法,其中,包括:文本數據預處理、文本表示、特征降維、分類模型訓練以及分類性能評估;文本數據預處理具體包括:按照順序需要對文本數據進行操作:文本標記、文本分詞處理以及去除停用詞處理;文本表示包括:經過文本預處理之后,將文本表示成一種形式化數學描述,使之成為計算機能夠識別的語言;卡方統計算法以及互信息算法,進行特征降維。本發(fā)明在CHI中引入詞頻因子,MI中引入調節(jié)因子,形成新的特征選取算法CHMI,理論效果優(yōu)于卡方統計和互信息算法,實現了快速、準確獲取到目標數據。

技術領域

本發(fā)明涉及文本分類技術,特別涉及一種基于機器學習的文本分類方法。

背景技術

隨著互聯網和社交媒體的發(fā)展,目前網絡上已經有海里的文本信息,包括維基百科詞條、學術文章、新聞報道、以及各種售后服務評論,而這些文本信息中蘊含了大量有價值的信息,

在海量的電子文本數據之中想要實現快速、準確獲取到目標數據,對文本文檔實現合理分類就變成了這個過程當中一個非常直接和現實的迫切問題。

20世紀80年代以前,受限于技術的發(fā)展,處理文本分類這類問題時,通行的做法是通過專家制定規(guī)則、人為地選擇、制定分類準則從而完成分類器的指導和搭建工作。比較著名的例子是Carnegine Group為路透社開發(fā)的CONSTRUE系統,該系統首先由專業(yè)人員設計編寫分類規(guī)則并指導系統完成分類鞏固走,主要用于對新聞稿件實現自動分類;同時期還有美國白宮采用的一種郵件分類系統,主要用于對電子郵件的自動分揀和處理工作。這種分類方法在當時取得了比較好的效果,并對文本分類技術起到了積極作用和產生了深遠影響。

通過知識工程構建起來的分類器有諸多缺陷:首先需要人類專家根據對待分類文檔進行特征分析、總結得到對象特點的基礎上,再人為設計提出并選定適當規(guī)則,并且針對一個領域所建立的文本分類器在應對其他知識領域的分類情況時,往往回出現分類效果不佳等問題,主要原因在于通過知識工程構建文本分類方法的過程中存在對專家能力過度依賴。由于人類專家研究領域有限,所建立的文本分類器的有效領域也是有限的,在其他領域使用會出現可復現性差或遷移能力差等相關問題。此外,在涉及到數據集規(guī)模較大較復雜的文本分類情況時,為應對比較大的工作量又需要大量的專家參與其中,故又顯示出方法不夠聰明并且費時費力的缺陷。

發(fā)明內容

本發(fā)明通過引入一種基于機器學習的文本分類方法,以此進行更高效的文本分類。

本發(fā)明一種基于機器學習的文本分類方法,其中,包括:文本數據預處理、文本表示、特征降維、分類模型訓練以及分類性能評估;文本數據預處理具體包括:按照順序需要對文本數據進行操作:文本標記、文本分詞處理以及去除停用詞處理;文本表示包括:經過文本預處理之后,將文本表示成一種形式化數學描述,使之成為計算機能夠識別的語言;卡方統計算法以及互信息算法,進行特征降維;分類模型訓練包括:采用SVM來進行分類,定義訓練數據集中的兩個類別中幾何距離最近的兩組數據為支持向量,超平面H就是與這兩組分屬于不同類別的數據連線的垂直平分線,而分類線H1與H2分別是指經過這兩個類別中支持向量,首先尋找支持向量,通過訓練集中不同類數據的幾何距離來剔除大量冗余數據,根據保留的少量數據即支持向量,找到超平面H進行類別劃分。

根據本發(fā)明所述的基于機器學習的文本分類方法的一實施例,其中,文本標記的處理包括:文本中的表情符、圖片或者鏈接非中文字符無法對文本分類提高直接且有用的幫助,進行刪除。

根據本發(fā)明所述的基于機器學習的文本分類方法的一實施例,其中,去除停用詞包括:經過分詞處理之后的文本數據仍然還存在許多功能詞和停用詞,對停用詞和功能詞進行額外刪除。

根據本發(fā)明所述的基于機器學習的文本分類方法的一實施例,其中,文本分詞的處理包括:首先識別出中文語句中存在的標點符號或是某些漢語文字,并在這些出現位置上通過添加空格符實現切分效果并得到切分后的詞條內容,相鄰字通過統計學方法得到分布信息,如果得到統計值很高達到一定閾值時,就判定這組相鄰的字就可能是一個詞語。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于航天科工網絡信息發(fā)展有限公司,未經航天科工網絡信息發(fā)展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202011544023.0/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發(fā)明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業(yè)標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 91久久国产露脸精品国产护士| 91理论片午午伦夜理片久久 | 热99re久久免费视精品频软件| 国产视频二区| 一区二区欧美在线| 亚洲精品久久久久中文第一暮| 97视频一区| 午夜一二区| 午夜性电影| 中文字幕精品一区二区三区在线| 国产一区二区精华| 亚洲高清毛片一区二区| 午夜黄色大片| 亚洲精品国产久| 国产精品久久久久久av免费看| 国产一区二区三区大片| 思思久久96热在精品国产| 91香蕉一区二区三区在线观看| 午夜免费网址| 欧美午夜一区二区三区精美视频| 国产欧美精品一区二区三区小说 | 国产原创一区二区| 欧美日韩中文字幕三区| 国产精品videossex国产高清| 午夜一区二区三区在线观看| 狠狠色狠狠色综合婷婷tag| 91区国产| 99爱精品视频| 91九色精品| 午夜电影天堂| 日本护士hd高潮护士| 香港日本韩国三级少妇在线观看| 国产亚洲精品久久yy50| 亚洲第一区国产精品| 国产69精品福利视频| 精品99免费视频| 午夜诱惑影院| 亚洲欧美另类国产| 一区二区三区电影在线观看| 国产精品日韩在线观看| 亚洲精品一区二区另类图片| av国产精品毛片一区二区小说| 丰满少妇高潮惨叫久久久| 精品国产91久久久| 国产一区二区视频在线| 国产在线一区观看| 91午夜精品一区二区三区| 国产不卡一区在线| 欧美激情片一区二区| 99精品在免费线偷拍| 久久国产精品免费视频| 欧美精品在线观看一区二区| 国产精彩视频一区二区| 高清国产一区二区| 亚洲国产一区二| 99爱国产精品| 日本一区二区免费电影| 久久乐国产精品| 中文字幕天天躁日日躁狠狠躁免费| 午夜毛片在线看| 国产jizz18女人高潮| 午夜精品99| 99精品黄色| 91香蕉一区二区三区在线观看| 综合色婷婷一区二区亚洲欧美国产| 国产一a在一片一级在一片| 99精品偷拍视频一区二区三区| 国产区91| 麻豆国产一区二区| 国产精品第56页| 国产淫片免费看| 日韩精品免费一区二区中文字幕 | 亚洲欧美国产精品一区二区| 日韩精品在线一区二区三区| 国产精品一区二区久久乐夜夜嗨 | 亚洲欧美国产日韩综合| 国产不卡网站| 日韩欧美国产精品一区| 欧美日韩国产精品一区二区三区| 国产福利一区在线观看| 精品视频久| 国产精品色在线网站| 亚洲精华国产欧美| 久久国产这里只有精品| 中文字幕在线乱码不卡二区区| 粉嫩久久99精品久久久久久夜| 国产精品日韩一区二区| 欧美精品在线观看视频| 国产欧美亚洲精品第一区软件| 日韩一级免费视频| 国产欧美精品va在线观看| 国产丝袜在线精品丝袜91| 久久久久久久亚洲视频| 久久国产精品-国产精品| 在线精品国产一区二区三区88| 国产亚洲精品久久网站| 日日夜夜精品免费看| 日本一二区视频| 国产乱码一区二区三区| 国产欧美二区| 国产精品日韩三级| 999偷拍精品视频| 国产在线不卡一| 国产精品自拍不卡| 午夜一区二区视频| 亚洲精品国产主播一区| 性欧美1819sex性高播放| 99久久国产综合精品尤物酒店| 一区二区在线精品| 在线国产二区| 日韩精品免费一区二区夜夜嗨| 久久精品爱爱视频| 国产二区三区视频| 日本一区二区三区四区高清视频| 免费在线观看国产精品| 精品久久不卡| 国产精品69久久久| 亚洲免费永久精品国产| 国产电影一区二区三区下载| 午夜毛片在线| 日韩一区高清| 欧美日本91精品久久久久| 国产97在线播放| 亚洲在线久久| 国产91免费观看| 久久久久久久久亚洲精品一牛| 午夜av网址| 91麻豆精品国产91久久久更新时间| 午夜天堂电影| 思思久久96热在精品国产| 国产一区二区国产| 欧美一区二区三区免费观看视频| 日本一区欧美| 国产综合久久精品| 中文丰满岳乱妇在线观看| 国产午夜亚洲精品午夜鲁丝片| 91精品一区| 99er热精品视频国产| 亚洲欧美v国产一区二区| 精品一区二区三区影院| 日韩欧美一区二区久久婷婷| 国产日韩精品久久| 国产一区午夜| 国产欧美一区二区在线| 国产1区在线观看| 亚洲高清久久久| 亚洲制服丝袜中文字幕| 午夜剧场伦理| 欧美亚洲精品一区二区三区| 国产精品刺激对白麻豆99| 精品国产一区二区三区高潮视| 久久国产精品99国产精| 国产激情视频一区二区| 国产免费一区二区三区网站免费| 欧美一区二区三区精品免费| 日韩亚洲国产精品| 精品一区二区三区中文字幕| 99久久婷婷国产综合精品草原| 久久综合二区| 亚洲日本国产精品| 国产日韩欧美精品| 亚洲精品卡一| 中文在线√天堂| 国产91久久久久久久免费| 国产一级片子| 亚洲高清国产精品| 青苹果av| 狠狠躁夜夜躁2020| 国产1区在线观看| 日韩精品一区二区久久| 久久精品国产久精国产| 一区二区三区欧美在线| 中文字幕欧美日韩一区 | 激情久久久久久| 国产999久久久| 久久久久久国产精品免费| 欧美日本91精品久久久久| 96国产精品| 国产精自产拍久久久久久蜜| 亚洲欧美一卡二卡| 国产精品白浆一区二区| 日本精品一区视频| 91看片免费| 亚洲欧美制服丝腿| 国产一区二区极品| 国产欧美精品一区二区三区-老狼| 69xx国产| 丝袜脚交一区二区| 国产第一区二区| 99久久精品免费看国产交换| 一色桃子av| 在线国产一区二区| 亚洲精品国产精品国产| 欧美在线免费观看一区| 国产精品一区二区在线观看免费| 成年人性生活免费看| 欧美色综合天天久久| 99久久精品国产国产毛片小说| 久久91久久久久麻豆精品| 91精品国产高清一区二区三区| xoxoxo亚洲国产精品| 欧美一区二区三区久久| 伊人久久婷婷色综合98网| 国产一区日韩一区| 久久久人成影片免费观看| 男女视频一区二区三区| 玖玖爱国产精品| 国产日韩欧美在线一区| 91热精品| 精品国产仑片一区二区三区| 99精品久久久久久久婷婷| 99精品国产一区二区三区麻豆| 国内久久久| 亚洲精品无吗| 欧美一区二区三区久久精品视 | 99国产精品9| 欧美国产精品久久| 欧美日韩国产一二三| 欧美三级午夜理伦三级老人| 国产韩国精品一区二区三区| 国产超碰人人模人人爽人人添| 曰韩av在线| 偷拍久久精品视频| 国产一区2区3区| 日韩午夜电影在线| 免费观看又色又爽又刺激的视频| 欧美精品一卡二卡| 国产欧美精品一区二区三区小说 | 欧美日韩国产在线一区二区三区| 99久久免费精品国产男女性高好| 欧美日韩精品在线一区二区| 欧美一区二区三区久久精品视| 色噜噜日韩精品欧美一区二区| 亚洲精品20p| 国产精品18久久久久久白浆动漫| 综合欧美一区二区三区| 伊人精品一区二区三区| 日韩中文字幕区一区有砖一区| 97午夜视频| 精品无人国产偷自产在线| 日本亚洲国产精品| 国产精品色在线网站| 国产福利一区在线观看| 久久第一区| 日韩毛片一区| 国产一区激情|