日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種基于機器學習的文本分類方法在審

專利信息
申請?zhí)枺?/td> 202011544023.0 申請日: 2020-12-24
公開(公告)號: CN113157912A 公開(公告)日: 2021-07-23
發(fā)明(設計)人: 劉建雄;陳敏 申請(專利權)人: 航天科工網(wǎng)絡信息發(fā)展有限公司
主分類號: G06F16/35 分類號: G06F16/35;G06F40/216;G06K9/62;G06N20/10
代理公司: 中國兵器工業(yè)集團公司專利中心 11011 代理人: 張然
地址: 100854 *** 國省代碼: 北京;11
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 基于 機器 學習 文本 分類 方法
【權利要求書】:

1.一種基于機器學習的文本分類方法,其特征在于,包括:

文本數(shù)據(jù)預處理、文本表示、特征降維、分類模型訓練以及分類性能評估;

文本數(shù)據(jù)預處理具體包括:按照順序需要對文本數(shù)據(jù)進行操作:文本標記、文本分詞處理以及去除停用詞處理;

文本表示包括:經(jīng)過文本預處理之后,將文本表示成一種形式化數(shù)學描述,使之成為計算機能夠識別的語言;

卡方統(tǒng)計算法引入詞頻因子,以及互信息算法引入調(diào)節(jié)因子,進行特征降維;

分類模型訓練包括:采用SVM來進行分類,定義訓練數(shù)據(jù)集中的兩個類別中幾何距離最近的兩組數(shù)據(jù)為支持向量,超平面H就是與這兩組分屬于不同類別的數(shù)據(jù)連線的垂直平分線,而分類線H1與H2分別是指經(jīng)過這兩個類別中支持向量,首先尋找支持向量,通過訓練集中不同類數(shù)據(jù)的幾何距離來剔除大量冗余數(shù)據(jù),根據(jù)保留的少量數(shù)據(jù)即支持向量,找到超平面H進行類別劃分。

2.如權利要求1所述的基于機器學習的文本分類方法,其特征在于,文本標記的處理包括:文本中的表情符、圖片或者鏈接非中文字符無法對文本分類提高直接且有用的幫助,進行刪除。

3.如權利要求2所述的基于機器學習的文本分類方法,其特征在于,去除停用詞包括:經(jīng)過分詞處理之后的文本數(shù)據(jù)仍然還存在許多功能詞和停用詞,對停用詞和功能詞進行額外刪除。

4.如權利要求2所述的基于機器學習的文本分類方法,其特征在于,文本分詞的處理包括:首先識別出中文語句中存在的標點符號或是某些漢語文字,并在這些出現(xiàn)位置上通過添加空格符實現(xiàn)切分效果并得到切分后的詞條內(nèi)容,相鄰字通過統(tǒng)計學方法得到分布信息,如果得到統(tǒng)計值很高達到一定閾值時,就判定這組相鄰的字就可能是一個詞語。

5.如權利要求1所述的基于機器學習的文本分類方法,其特征在于,文本表示通過VSM模型表示成一種形式化數(shù)學描述,通過將文本中帶有文本主題特征的那些詞項表示成特征向量,每一個具有獨立屬性的詞項所對應的一個特征向量就構成了這篇文本特征向量的一個維度,將文本轉(zhuǎn)化成了空間中的一個高維特征向量。

6.如權利要求5所述的基于機器學習的文本分類方法,其特征在于,利用VSM模型對文本進行文本表示時,詞項以及詞項的權重將成為文本表示這個模型的組成部分,文本D就能被n個詞項以及他們的權重值所組成的特征向量代表,表示形式如下:D={(t1,w1),(t2,w2),...,(ti,wj),...(tn,wn)},其中ti,wj分別是指對應的第i個特征詞以及第i個特征詞的權重值。

7.如權利要求1所述的基于機器學習的文本分類方法,其特征在于,卡方統(tǒng)計算法包括:

卡方統(tǒng)計算法公式基于詞項的詞頻因子,其大小等于這個詞項在該類別文檔中出現(xiàn)的詞頻數(shù)與在全體文本數(shù)據(jù)集文檔中存在該詞項的文本頻數(shù)大小的比值。其計算公式:

n(ti,cj)是指詞項ti在類別結果為cj的文檔中出現(xiàn)的次數(shù),n(ti)是指在全體文本數(shù)據(jù)集文檔中,文本中存在詞項ti的文本頻數(shù);

詞頻因子α(ti)的大小由詞項ti在某類別文檔中出現(xiàn)的頻數(shù)以及這個詞項在全體文本數(shù)據(jù)集文檔中出現(xiàn)的頻數(shù)大小所決定。詞頻因子α(ti)數(shù)值越大,代表該詞項ti只在這一個類別文檔中出現(xiàn)的頻率越高;詞頻因子α(ti)數(shù)值越小,代表該詞項ti只在這一個類別文檔中出現(xiàn)的頻率越小,引入詞頻因子α(ti),利用卡方統(tǒng)計算法更容易找到對分類更有幫助的特征詞。

8.如權利要求7所述的基于機器學習的文本分類方法,其特征在于,互信息算法包括:

提出基于詞項的調(diào)節(jié)因子,大小等于該類別文檔中存在這個詞頻的文本書與該類別文檔中總文本數(shù)大小的比值,其計算公式如下:

D(ti,cj)是指在類別結果為cj的文檔中存在詞項ti的文本頻數(shù),d(cj)是指類別結果為cj的文檔中的總文本頻數(shù);

調(diào)節(jié)因子D(ti,cj)的大小由在類別文檔中存在詞項ti的文本頻數(shù)以及在這個類別文檔中不存在詞項ti的文本頻數(shù)所決定,調(diào)節(jié)因子D(ti,cj)數(shù)值越大,代表在類別結果為cj的文檔中出現(xiàn)存在詞項ti的文本比例越高,反之越小,這樣的詞項在該類別文檔中更可能是低頻詞。

下載完整專利技術內(nèi)容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于航天科工網(wǎng)絡信息發(fā)展有限公司,未經(jīng)航天科工網(wǎng)絡信息發(fā)展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202011544023.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產(chǎn)權局專利說明書;

2、支持發(fā)明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 伊人精品一区二区三区| 国产一区二区三区国产| 亚洲精品丝袜| freexxxx性| 午夜天堂电影| 91麻豆国产自产在线观看hd| 国产美女一区二区三区在线观看| 99国产午夜精品一区二区天美 | 一区二区三区欧美日韩| 北条麻妃久久99精品| 99久久精品国产系列| 亚洲精品人| 19videosex性欧美69| 91麻豆精品国产91久久久久| 国产97免费视频| 456亚洲精品| 少妇**毛片| 国产高清一区在线观看| 激情久久影院| 国产精品亚发布| 国产一区日韩一区| 国产有码aaaae毛片视频| 中文字幕日韩精品在线| 久久九精品| 久久久久久久久久国产精品| 亚洲一区二区三区加勒比| 亚洲影院久久| 国产免费一区二区三区四区五区| 欧美激情精品久久久久久免费| 国产999精品视频| 国内久久久| 91精品视频在线观看免费| 午夜av在线电影| 少妇又紧又色又爽又刺激的视频| 国产高清精品一区| 日韩av在线网址| 午夜黄色网址| 国产一区二区在| 国产无遮挡又黄又爽又色视频| 久久久中精品2020中文| 国产麻豆一区二区三区在线观看| 亚洲乱玛2021| 国产一区二区视频在线| 99精品国产99久久久久久97| 精品福利一区| 国产精品精品视频一区二区三区| 国产91免费在线| 91亚洲欧美强伦三区麻豆| 日本99精品| 欧美日韩精品中文字幕| 国产免费区| 欧美一级片一区| 午夜电影毛片| 97国产婷婷综合在线视频,| 欧美精品日韩精品| 狠狠色丁香久久婷婷综合丁香| 99久久夜色精品国产网站| 国产黄色一区二区三区| 日本精品一二三区| 欧美精品国产精品| 91精品福利观看| 欧美一区二区免费视频| 99久久精品一区字幕狠狠婷婷| 日韩国产精品一区二区| 福利视频亚洲一区| 欧美一区二区伦理片| 久久久人成影片免费观看| 香蕉av一区| 国产精品国产三级国产播12软件| 国产精品一区在线观看你懂的 | 久久久久久久久亚洲精品一牛| 亚洲视频h| 国产中文字幕一区二区三区| 国产日韩欧美另类| 欧美日韩一区不卡| 欧美一区二区三区不卡视频| 91麻豆精品国产91久久久更新资源速度超快 | 欧美日韩一区二区三区在线播放| 国产精品日韩高清伦字幕搜索| 国产欧美一区二区三区免费看| 午夜av免费看| 亚洲福利视频二区| 中文丰满岳乱妇在线观看| 国产在线精品一区| 国产欧美精品一区二区三区小说| 欧美高清视频一区二区三区| 国产精品高潮在线| 久久久久久国产精品免费| 国产极品一区二区三区| 欧美一区二区久久| 精品国产区一区二| 国产大片黄在线观看私人影院 | 欧洲另类类一二三四区| 久久久精品欧美一区二区| 91免费视频国产| 日本神影院一区二区三区| 国产精品自拍不卡| 欧美久久久一区二区三区| 日本神影院一区二区三区| 国产乱码精品一区二区三区中文| 91精品久久天干天天天按摩 | 国产一区二区91| 国产99久久九九精品| 国产美女三级无套内谢| 欧美日韩国产一二三| 88国产精品视频一区二区三区| 中文无码热在线视频| 美女啪啪网站又黄又免费| 免费观看xxxx9999片| 亚洲国产aⅴ精品一区二区16| 中文字幕在线播放一区| 97久久精品人人做人人爽| 国产精品视频一区二区在线观看| 国产免费一区二区三区四区五区 | 偷拍精品一区二区三区| 狠狠色噜噜狠狠狠狠米奇7777| 狠狠干一区| 国内自拍偷拍一区| 亚洲乱玛2021| 一区二区精品在线| 亚洲欧洲日韩在线| 特级免费黄色片| 午夜爱爱电影| 99精品小视频| 国产精品欧美一区二区三区奶水| 午夜理伦影院| 国产精品理人伦一区二区三区 | 日本边做饭边被躁bd在线看 | 亚洲欧美一区二区精品久久久| 99爱精品在线| 国产亚洲精品久久午夜玫瑰园| 91精品国产影片一区二区三区| xxxxhd欧美| 国产黄色网址大全| 日本丰满岳妇伦3在线观看| 亚洲久久在线| 97人人模人人爽人人喊38tv| 国产欧美日韩二区| 日本一区二区欧美| 午夜少妇性影院免费观看| 中文字幕天天躁日日躁狠狠躁免费 | 亚洲欧美国产精品久久| 日韩午夜三级| 国产全肉乱妇杂乱视频在线观看 | 99精品区| 亚洲精品久久久久不卡激情文学| 欧美精品日韩| 一区二区久久久久| av午夜在线观看| 99久久夜色精品| 中文字幕一区二区三区乱码视频 | 亚洲午夜久久久久久久久电影院| 99国产精品免费观看视频re| 亚洲国产精品一区在线| 狠狠躁日日躁狂躁夜夜躁av| 欧美日韩久久一区二区| 国产欧美亚洲精品第一区软件| 国产欧美亚洲精品| 麻豆91在线| 国产性生交xxxxx免费| 欧洲激情一区二区| 亚洲精品国产91| 国产精品1区二区| 国产一区日韩在线| 精品婷婷伊人一区三区三| 一区精品二区国产| 伊人av综合网| 91超碰caoporm国产香蕉| 欧美黄色一二三区| 欧美一区二区免费视频| 午夜码电影| 国产一区二区伦理| 99久久久久久国产精品| **毛片在线| 欧美大片一区二区三区| 久久99精品久久久野外直播内容| 国产精品伦一区二区三区级视频频 | 猛男大粗猛爽h男人味| 欧美精品一区二区久久| 国产偷国产偷亚洲清高| 91精品国产91热久久久做人人| 国产欧美一区二区在线| 国产极品美女高潮无套久久久| 亚洲国产欧美一区| 国产电影精品一区| 欧美性猛交xxxxxⅹxx88| 久久人91精品久久久久久不卡| 国产v亚洲v日韩v欧美v片| 欧美日韩三区二区| 欧美日韩九区| 亚洲一区二区福利视频| 国产1区2区3区| 91一区二区三区视频| 日韩中文字幕在线一区| 91精彩刺激对白露脸偷拍 | 国产性生交xxxxx免费| 午夜影院激情| 狠狠操很很干| 91精品色| 欧美日韩国产一区二区三区在线观看| 欧美一级日韩一级| 在线视频国产一区二区| 国产的欧美一区二区三区 | 日韩av在线电影网| 91偷拍网站| 丝袜美腿诱惑一区二区| 国产日韩欧美一区二区在线播放| 久久久精品a| 久久精品亚洲精品| 亚洲欧美另类综合| 午夜av资源| 午夜爽爽视频| 欧美在线视频一二三区| 欧美乱偷一区二区三区在线| 国产精品久久久久久一区二区三区| 国产一区在线免费| 三级午夜片| 国产午夜三级一二三区| 鲁一鲁一鲁一鲁一鲁一av| 狠狠色噜噜狠狠狠狠| 福利电影一区二区三区| 国产91九色在线播放| 夜夜嗨av一区二区三区中文字幕| 97久久精品一区二区三区观看| 久久99中文字幕| 美国三级日本三级久久99| 大bbw大bbw巨大bbb| 精品久久一区| 四虎国产精品久久| 久99精品| 亚洲国产美女精品久久久久∴| 制服丝袜视频一区| 欧美日韩一级在线观看| 国产黄色网址大全| 欧美国产三区| 亚洲国产精品一区二区久久hs | 日韩一级视频在线| 午夜影院5分钟| 国产在线一卡二卡| 欧美一区二区三区久久精品| 精品国产一区二区三| 麻豆天堂网| 国产一区二区电影| 日本边做饭边被躁bd在线看| 欧美精品一区二区三区在线四季| 午夜影院试看五分钟|