日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種文本數(shù)據(jù)分類方法及服務(wù)器有效

專利信息
申請(qǐng)?zhí)枺?/td> 201610296812.4 申請(qǐng)日: 2016-05-06
公開(kāi)(公告)號(hào): CN107346433B 公開(kāi)(公告)日: 2020-09-18
發(fā)明(設(shè)計(jì))人: 馬洪芹 申請(qǐng)(專利權(quán))人: 華為技術(shù)有限公司
主分類號(hào): G06K9/62 分類號(hào): G06K9/62;G06F16/35
代理公司: 廣州三環(huán)專利商標(biāo)代理有限公司 44202 代理人: 郝傳鑫;熊永強(qiáng)
地址: 518129 廣東*** 國(guó)省代碼: 廣東;44
權(quán)利要求書(shū): 查看更多 說(shuō)明書(shū): 查看更多
摘要:
搜索關(guān)鍵詞: 一種 文本 數(shù)據(jù) 分類 方法 服務(wù)器
【說(shuō)明書(shū)】:

發(fā)明實(shí)施例公開(kāi)了一種文本數(shù)據(jù)分類方法及服務(wù)器,該方法包括:服務(wù)器通過(guò)支持向量機(jī)SVM算法對(duì)第一訓(xùn)練集進(jìn)行分析,并根據(jù)分析得到的第一分類模型對(duì)第一測(cè)試集進(jìn)行分類測(cè)試,第一訓(xùn)練集和第一測(cè)試集均包含多個(gè)支持向量,每個(gè)支持向量包含K個(gè)與K個(gè)特征詞對(duì)應(yīng)的權(quán)重因子,每個(gè)特征因子對(duì)應(yīng)一個(gè)特征詞;根據(jù)目標(biāo)支持向量的權(quán)重因子和第一分類模型中的參數(shù)計(jì)算K個(gè)特征詞中每個(gè)特征詞在目標(biāo)支持向量中的相對(duì)權(quán)重;通過(guò)SVM算法對(duì)第二訓(xùn)練集進(jìn)行分析,并根據(jù)分析得到的第二分類模型對(duì)第二測(cè)試集進(jìn)行分類測(cè)試,第二訓(xùn)練集和第二測(cè)試集中的支持向量均包含K個(gè)特征詞中的除目標(biāo)特征詞以外的特征詞對(duì)應(yīng)的權(quán)重因子。采用本發(fā)明,能夠降低分類模型分類的錯(cuò)誤率。

技術(shù)領(lǐng)域

本發(fā)明涉及計(jì)算機(jī)技術(shù)領(lǐng)域,尤其涉及一種文本數(shù)據(jù)分類方法及服務(wù)器。

背景技術(shù)

支持向量機(jī)(英文:Support Vector Machine,簡(jiǎn)稱:SVM)是一個(gè)有監(jiān)督的學(xué)習(xí)模型,通常用來(lái)進(jìn)行模式識(shí)別、分類、以及回歸分析等。圖1是現(xiàn)有技術(shù)中基于SVM算法進(jìn)行數(shù)據(jù)分類的流程示意圖,具體包括:

分類服務(wù)器獲取已分類的文本數(shù)據(jù)并通過(guò)預(yù)設(shè)的分詞算法提取該已分類的文本數(shù)據(jù)中的特征詞。計(jì)算各個(gè)特征詞的權(quán)重并通過(guò)向量分別表示每個(gè)特征詞的權(quán)重。將得到的向量中的一部分向量作為訓(xùn)練集,以及將得到的向量中的另一部分向量作為測(cè)試集。通過(guò)SVM訓(xùn)練系統(tǒng)對(duì)該訓(xùn)練集中的向量進(jìn)行分析以得到模型文件,通過(guò)該模型文件對(duì)該測(cè)試集中的向量分類。參照預(yù)先分類的結(jié)果判斷通過(guò)該分類模型分類的結(jié)果的錯(cuò)誤率是否在預(yù)設(shè)范圍內(nèi),若錯(cuò)誤率不在預(yù)設(shè)范圍內(nèi),則重新獲取訓(xùn)練集并基于獲取的新訓(xùn)練集計(jì)算模型文件,若錯(cuò)誤率在預(yù)設(shè)范圍內(nèi),則將該模型文件作為對(duì)文本數(shù)據(jù)進(jìn)行分類的模型。然后,獲取未分類數(shù)據(jù)并通過(guò)預(yù)設(shè)的分詞算法提取該未分類數(shù)據(jù)中的特征詞;計(jì)算各個(gè)特征詞的權(quán)重并通過(guò)向量表示特征詞的權(quán)重;通過(guò)分類的錯(cuò)誤率落入預(yù)設(shè)范圍的模型文件對(duì)該向量分類并輸出分類結(jié)果。

現(xiàn)有技術(shù)的缺陷在于,當(dāng)分類模型分類結(jié)果的錯(cuò)誤率超出預(yù)設(shè)范圍時(shí),重新獲取的訓(xùn)練集具有偶然性,不一定能夠降低該模型文件分類的錯(cuò)誤率。

發(fā)明內(nèi)容

本發(fā)明實(shí)施例公開(kāi)了一種文本數(shù)據(jù)分類方法及服務(wù)器,能夠降低分類模型分類的錯(cuò)誤率。

第一方面,本發(fā)明實(shí)施例提供一種文本數(shù)據(jù)分類方法,該方法包括:

服務(wù)器通過(guò)支持向量機(jī)SVM算法對(duì)第一訓(xùn)練集進(jìn)行分析,并根據(jù)分析得到的第一分類模型對(duì)第一測(cè)試集進(jìn)行分類測(cè)試,所述第一訓(xùn)練集和所述第一測(cè)試集均包含多個(gè)支持向量,每個(gè)支持向量包含K個(gè)與K個(gè)特征詞對(duì)應(yīng)的權(quán)重因子,每個(gè)所述權(quán)重因子對(duì)應(yīng)一個(gè)特征詞,所述權(quán)重因子的數(shù)值大小與所述權(quán)重因子對(duì)應(yīng)的特征詞在所述支持向量描述的文本數(shù)據(jù)中出現(xiàn)的次數(shù)成正相關(guān),K為大于1的正整數(shù);

所述服務(wù)器根據(jù)目標(biāo)支持向量的權(quán)重因子和所述第一分類模型中的參數(shù)計(jì)算所述K個(gè)特征詞中每個(gè)特征詞在所述目標(biāo)支持向量中的相對(duì)權(quán)重,所述目標(biāo)支持向量為所述第一測(cè)試集中利用所述第一分類模型得到的分類測(cè)試結(jié)果與預(yù)設(shè)分類不相符的支持向量;

所述服務(wù)器通過(guò)所述SVM算法對(duì)第二訓(xùn)練集進(jìn)行分析,并根據(jù)分析得到的第二分類模型對(duì)第二測(cè)試集進(jìn)行分類測(cè)試,所述第二訓(xùn)練集和所述第二測(cè)試集中的支持向量均包含所述K個(gè)特征詞中的除目標(biāo)特征詞以外的特征詞對(duì)應(yīng)的權(quán)重因子,所述目標(biāo)特征詞為所述目標(biāo)支持向量中的相對(duì)權(quán)重小于第一預(yù)設(shè)閾值的特征詞;如果通過(guò)所述第二分類模型分類測(cè)試得到的分類錯(cuò)誤率不高于目標(biāo)預(yù)設(shè)閾值時(shí),確認(rèn)使用所述第二分類模型對(duì)待分類的文本數(shù)據(jù)進(jìn)行分類。可選的,特征詞在該目標(biāo)支持向量中的權(quán)重與該特征詞在該目標(biāo)支持向量對(duì)應(yīng)的文本數(shù)據(jù)中的出現(xiàn)的次數(shù)成正相關(guān),該權(quán)重可以通過(guò)權(quán)重因子來(lái)表示;該特征詞在該第一訓(xùn)練集中的權(quán)重具體指該特征詞在該第一訓(xùn)練集中各個(gè)支持向量中的權(quán)重進(jìn)行加權(quán)得到的權(quán)重,例如,該第一訓(xùn)練集中包含支持向量X1、X2、X3和X4,將特征詞1在X1中的權(quán)重、特征詞1在X2中的權(quán)重、特征詞1在X3中的權(quán)重和特征詞1在X3中的權(quán)重相加,并將相加得到的值除以4得到的值為該特征詞1在該第一訓(xùn)練集中的相對(duì)權(quán)重。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華為技術(shù)有限公司,未經(jīng)華為技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201610296812.4/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說(shuō)明:

1、專利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專利說(shuō)明書(shū);

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級(jí)中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級(jí)為極速版,下載速度顯著提升!歡迎使用!

請(qǐng)您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊(cè)】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識(shí) 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢?cè)诰€客服咨詢?cè)诰€客服
tel code back_top
主站蜘蛛池模板: 亚洲精品老司机| 日韩一区二区福利视频| 国产精品九九九九九九| 日韩av在线播| 色婷婷噜噜久久国产精品12p| 国产日韩精品一区二区三区| 欧美一区二区三区在线免费观看 | 国产精品国产亚洲精品看不卡15| 国产精品一区二区不卡| 午夜毛片在线| 日本美女视频一区二区| 69xx国产| 欧美精品第1页| 亚洲国产一区二区精华液| 午夜精品一区二区三区三上悠亚 | 免费精品一区二区三区第35| 欧美三区视频| 波多野结衣女教师电影| 精品国产一区二区三区麻豆免费观看完整版 | 韩国女主播一区二区| 国产一区日韩欧美| 三上悠亚亚洲精品一区二区| 欧美一区二区三区在线视频观看| 精品久久9999| 大桥未久黑人强制中出| 日韩av中文字幕一区二区| 亚洲国产精品国自产拍久久| 99久久精品国| 国产精品久久久久99| 国产精品一区二区日韩新区| 亚洲欧美一区二区精品久久久| 欧美乱妇高清无乱码免费| 欧美日韩一级在线观看| 中文字幕在线一二三区| 久久天天躁狠狠躁亚洲综合公司| 国产日韩精品一区二区| 日韩一区二区中文字幕| 国产精品一区在线播放| 精品一区电影国产| 中文字幕日韩有码| 亚洲一区欧美| 国产精品999久久久| 国产乱人伦精品一区二区三区| 中文字幕一区二区三区免费视频| 国产精品美女久久久免费| 欧美一区二区三区久久久精品 | xxxx18日本护士高清hd| 国产精品爽到爆呻吟高潮不挺| 又黄又爽又刺激久久久久亚洲精品 | 国产欧美日韩综合精品一| 欧美亚洲精品一区二区三区| 国产一区二区三区网站| 国产精品5区| 国产午夜精品一区二区三区最新电影| 亚洲四区在线观看| 午夜伦全在线观看| 欧美精品综合视频| 另类视频一区二区| 国产激情视频一区二区| 精品国产一二区| 91精品一区在线观看| 国产人伦精品一区二区三区 | 首页亚洲欧美制服丝腿| 91视频一区二区三区| 97精品国产97久久久久久| 免费观看黄色毛片| 日本高清二区| 欧美xxxxhdvideos| 国产女人和拘做受视频免费| 国产在线干| 在线国产一区二区| 国产欧美一区二区精品久久久| 亚洲精品一区,精品二区| 日韩欧美中文字幕精品| 久久人人97超碰婷婷开心情五月| 国产一级精品在线观看| 黄色国产一区二区| 欧美精品久| 亚洲va国产| 午夜裸体性播放免费观看| 精品国产一区二区三区久久久久久 | 国产精品欧美一区乱破|