日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]參考外部知識構建文本分類器的方法和設備有效

專利信息
申請號: 200910171947.8 申請日: 2009-09-22
公開(公告)號: CN102023986A 公開(公告)日: 2011-04-20
發明(設計)人: 李建強;趙彧;劉博 申請(專利權)人: 日電(中國)有限公司
主分類號: G06F17/30 分類號: G06F17/30
代理公司: 北京東方億思知識產權代理有限責任公司 11258 代理人: 李曉冬;南霆
地址: 100084 北京市海淀區中*** 國省代碼: 北京;11
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 參考 外部 知識 構建 文本 分類 方法 設備
【說明書】:

技術領域

本發明一般地涉及信息檢索和文本分類。更具體而言,本發明涉及參考外部知識構建文本分類器的方法和設備。

背景技術

隨著電子化辦公和因特網的飛速發展,電子文本的信息量成爆炸趨勢增長,并且大規模的自動信息處理已經成為人們更好地利用這種大規模信息的必要手段和挑戰。

信息檢索是指信息按一定的方式組織起來,并根據信息用戶的需要找出有關的信息的過程和技術。而文本自動分類是實現信息檢索的主要支撐技術之一,其基本目的是將文本劃分到預定義的類中,幫助人們檢索、查詢、過濾和利用信息的有效手段。早期的文本分類采用的是基于知識工程和專家系統的方法,可是這樣的方法非常復雜和缺乏靈活性。隨著機器學習的興起和發展,很多機器學習的分類器模型被引入的文本分類領域中,從不同的方面取得了不錯的效果,目前已經成為實現自動文本分類的主流技術。

基于機器學習的文本分類通過最終構建的文本分類器來實現,而其性能很大程度上依賴于所使用的訓練數據(文本)集合,這樣就造成訓練數據的選擇成為其中的關鍵。

所謂訓練數據的選擇是指從給定的具有類別標簽的文本集合(標注文本集)中選擇其中的一個子集用來訓練相應的文本分類器。好的訓練數據選擇方法一方面通過減少訓練文本的數量能夠大幅度提高構建分類器的效率,另一方面通過提高訓練文本的質量提高訓練得到分類器的泛化能力和魯棒性,從而保證分類的精度。

目前已經存在一些相關的用于訓練文本選擇的專利和研究技術。

例如,在題為“Creating?taxonomies?and?training?data?for?document?categorization”的美國專利US?7409404B2中提供了一種訓練文本選擇技術,其主要在盡量消除擴類別的特征的干擾的前提下,通過給定標注文本的統計信息來精化訓練文本數據的質量。

另外,在Wang,J、Neskovic,P和Cooper,L.N所編寫的題為“Training?data?selection?for?support?vector?machines”的非專利文獻(In:LNCS?vol.3610?2005)(下稱非專利文獻1)中也描述了兩種利用給定標注文本集合的內部統計特征來進行訓練文本選擇并進而學習生成文本分類器的設備和方法。其具體結構框圖和工作流程如圖1和圖2所示。

如圖1所示,根據該現有技術的文本分類器構建設備100由輸入裝置101、文本向量化裝置102、基于統計方法的訓練文本選擇裝置103和分類器學習裝置104構成。輸入裝置101從標注文本存儲單元105輸入一組標注文本。文本向量化裝置102對輸入的每個標注文本進行向量化,并將生成的對應于每個標注文本的向量空間模型(VSM)存儲到向量空間模型(VSM)存儲單元106中。然后,基于統計方法的訓練文本選擇裝置103基于統計方法對已經向量化的每個標注文本進行打分并從中選出適當的訓練文本。選出的訓練文本隨后被分類器學習裝置104用于學習生成文本分類器。

圖2示出了圖1所示文本分類器構建設備100的示意性工作流程。在非專利文獻1所公開的技術內容中記載了兩種根據標注文本集合的內部特征來進行訓練文本選擇并進而學習生成文本分類器的示例性方法,即示例方法1和示例方法2。在示例方法1中,以每個標注文本xi為中心的最大的不包含其他類別的標注文本的圓形區域中所包含的標注文本的個數被記作N(xi);并且挑選其中具有最小N(xi)的圓形區域中的標注文本,作為訓練文本集。在示例方法2中,計算每個標注文本xi到其他類別的標注文本的凸集的距離d(xi);并且挑選具有最小d(xi)的標注文本,作為訓練文本。

無論示例方法1還是示例方法2,作為計算統計量的特征都只來源于給定的標注文本集自身,其中只考慮了給定標注文本集內部的樣本分布。因此,最后構建的文本分類器必然完全受給定標注文本的影響,從而造成此分類器的泛化能力和魯棒性差。

雖然現有技術中還存在其他訓練文本選擇方法,但是,目前的訓練文本選擇方法主要都是利用給定標注文本集中的內部知識來實現的,即,所采用的特征及權重完全依賴于給定標注文本集合的數據分布,從而使選擇出來的訓練文本會具有很強的偏向性。這種偏向性會傳播到最終構建的分類器的分類取向,使其泛化能力和魯棒性受到很大的影響,最終造成分類器性能不理想。

發明內容

本發明正是考慮到上述現有技術中存在的問題而研制的。

根據本發明的思想,來源于外部知識源(例如,詞義詞典)的外部特征被引入到訓練文本的選擇過程中,具體講,本發明的核心實現主要體現在以下兩個方面:

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于日電(中國)有限公司,未經日電(中國)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/200910171947.8/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产一区二区高潮| 国产一区二区三级| 午夜激情看片| 国产黄色一区二区三区| 日韩亚洲国产精品| 色乱码一区二区三在线看| 99久精品视频| 国产资源一区二区三区| 国产一区二区三区黄| 福利视频亚洲一区| 激情久久精品| 国产伦精品一区二| 欧美系列一区二区| 欧美极品少妇xxxxⅹ| 超碰97国产精品人人cao| 国产精品视频久久久久久| 精品国产一二区| 欧美精品亚洲一区| 视频一区二区三区中文字幕| 中文字幕另类日韩欧美亚洲嫩草| 91精品美女| 国产在线观看免费麻豆| 91久久综合亚洲鲁鲁五月天| 日韩av不卡一区二区| 国产69精品福利视频| 91精品国产综合久久婷婷香| 亚洲乱亚洲乱妇28p| 狠狠色噜狠狠狠狠| 国产二区视频在线播放| 国产麻豆精品久久| 国产精品麻豆99久久久久久| 亚洲码在线| 狠狠干一区| 国产一区二区免费在线| 久久一区二区精品| 久久人人97超碰婷婷开心情五月| 成年人性生活免费看| 国产乱码精品一区二区三区介绍| 三级午夜片| 香蕉视频一区二区三区| 人人澡超碰碰97碰碰碰| 91精品www| 国产91久| 电影午夜精品一区二区三区| 久久99精品国产麻豆婷婷| 四虎国产精品永久在线国在线| 91久久香蕉| 久久久久久久国产精品视频| 国产在线不卡一| 午夜大片男女免费观看爽爽爽尤物 | 一区二区三区国产精品视频| 午夜影院伦理片| 午夜色影院| 一区二区三区毛片| 国产一区二区三区精品在线| 国产精品免费观看国产网曝瓜| 日本三级不卡视频| 99精品黄色| 麻豆国产一区二区| 国产精品999久久久| 亚洲**毛茸茸| 性视频一区二区三区| 538在线一区二区精品国产| 亚洲乱小说| 99re久久精品国产| 日本一二三四区视频| 国产精品伦一区二区三区级视频频 | 国精偷拍一区二区三区| 中文字幕一区二区三区乱码 | 亚洲欧美日韩国产综合精品二区| 久久国产精品二区| 91午夜在线| 亚洲精品国产精品国产| 国产91电影在线观看| 亚洲精品一品区二品区三品区 | 久久国产精品麻豆| 国产理论片午午午伦夜理片2021| 午夜国产一区| 欧美乱妇高清无乱码一级特黄| 国产精品亚州| 久久国产欧美视频| 91丝袜国产在线播放| 国产在线精品一区二区| 亚洲精品乱码久久久久久高潮| 久久99亚洲精品久久99果| 亚洲国产一区二| 久久精品国产96| 精品久久久影院| 一区二区三区国产精品| 国产高清在线观看一区| av午夜在线| 日日夜夜一区二区| 九九久久国产精品| 欧美激情视频一区二区三区免费| 日韩av在线网址| 国产精品视频久久久久| 羞羞视频网站免费| 91片在线观看| 欧美一区二区三区黄| 99视频一区| 日韩av在线网| 91精品丝袜国产高跟在线| 国产视频精品久久| 97涩国一产精品久久久久久久| 午夜天堂电影| 久久99久国产精品黄毛片入口| 国产1区2区视频| 久久99精品国产99久久6男男 | 亚洲欧洲日韩在线| 国产有码aaaae毛片视频| 午夜电影一区| 中文字幕日韩有码| 欧美日韩高清一区二区| 免费精品99久久国产综合精品应用| 中文字幕久久精品一区| 日韩无遮挡免费视频| 久久99精品久久久久国产越南 | 国产呻吟久久久久久久92| 欧美精品一区二区三区在线四季| 高清欧美精品xxxxx| 国产乱人乱精一区二视频国产精品 | 亚洲欧美制服丝腿| 国产丝袜一区二区三区免费视频| 亚洲国产精品区| 欧美日韩一区二区三区四区五区六区| 99爱精品在线| 99久久国产综合精品色伊| 国产一级自拍片| 亚洲视频h| 97久久精品人人做人人爽| 精品少妇一区二区三区 | 日韩欧美多p乱免费视频| 久久久久国产亚洲日本| 欧美精品一区二区三区久久久竹菊| 91久久免费| 日韩欧美国产精品一区| 色综合久久综合| 久久精品一| 一区二区三区日韩精品| 狠狠色丁香久久婷婷综| 欧美乱码精品一区二区| 久99久视频| 午夜国产一区二区三区四区| 国产精品日韩一区二区| 日本午夜一区二区| 欧美精品六区| 国产69精品久久久久app下载 | 九九久久国产精品| 国产偷亚洲偷欧美偷精品| 91精品第一页| 亚洲四区在线观看| 一区二区欧美视频| 99国产精品丝袜久久久久久| 国产99久久久久久免费看| 日韩精品一区中文字幕| 国产精品一二二区| 午夜av片| 香港日本韩国三级少妇在线观看| 精品99免费视频| 99久久精品免费视频| 国产又黄又硬又湿又黄| 国产精品二区一区二区aⅴ| 欧美中文字幕一区二区| 19videosex性欧美69| 亚洲少妇中文字幕| 中文字幕av一区二区三区高| 国偷自产一区二区三区在线观看| 一区二区三区免费高清视频| 精品国产一级| 日本午夜无人区毛片私人影院| 色噜噜狠狠色综合中文字幕| 亚洲影院久久| 亚洲欧美日本一区二区三区| 一区二区三区国产精华| 欧美一级日韩一级| 国产精品一区二区不卡| 日韩欧美激情| 91亚洲欧美日韩精品久久奇米色| 国产色一区二区| 国产69精品久久久久9999不卡免费 | 欧美精品免费一区二区| 欧美激情精品一区| 亚洲va国产2019| 欧美一区二区三区久久精品视| freexxxx性| 日本边做饭边被躁bd在线看| 91久久精品国产亚洲a∨麻豆 | 欧美一区二区三区在线视频观看| 日日夜夜精品免费看| 68精品国产免费久久久久久婷婷| 狠狠色噜噜狠狠狠狠2021天天| 午夜激情看片| 久久噜噜少妇网站| 国产一二区在线观看| 国产精品免费不卡| 亚洲精品久久久久久久久久久久久久 | 日韩国产精品一区二区| 一区二区不卡在线| 国产精品一二三在线观看| 国产一级一区二区| 99国产精品永久免费视频| 四虎国产精品久久| 国产亚洲精品久久久456| 久久精品中文字幕一区| 一本大道久久a久久精品| 亚洲精品乱码久久久久久按摩| 亚洲欧美日韩在线| 欧美精品一区免费| 一区二区久久精品66国产精品| 三级午夜片| 国产乱一乱二乱三| 亚洲高清毛片一区二区| av狠狠干| 日韩精品一区在线观看| 狠狠色噜噜狠狠狠狠综合久| 日韩一区免费| 91麻豆精品国产91久久久久| 一区二区三区欧美精品| 91波多野结衣| 精品国产九九九| 亚洲精品久久久久中文第一暮| 国产在线精品二区| 欧美精品日韩精品| 天摸夜夜添久久精品亚洲人成 | 精品一区二区三区自拍图片区| 国产精品伦一区二区三区在线观看| 91免费国产视频| 久久噜噜少妇网站| 久久久99精品国产一区二区三区| 17c国产精品一区二区| 国产精品一区二区毛茸茸| 国产偷国产偷亚洲清高| 国产精品高潮呻吟88av| 国产一区2| 91丝袜国产在线观看| 国产在线卡一卡二| 欧美日韩高清一区二区| 国产一区二区在| 狠狠色成色综合网| 国产一区日韩在线| 99re国产精品视频| 蜜臀久久99静品久久久久久| 精品国产区一区二| 国产精品欧美一区二区三区奶水| 狠狠躁天天躁又黄又爽| 久久精品一|