日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]文本過濾系統(tǒng)及方法有效

專利信息
申請?zhí)枺?/td> 201210553556.4 申請日: 2012-12-18
公開(公告)號: CN103034726A 公開(公告)日: 2013-04-10
發(fā)明(設(shè)計)人: 閆俊英 申請(專利權(quán))人: 上海電機學(xué)院
主分類號: G06F17/30 分類號: G06F17/30;G06F17/27
代理公司: 上海思微知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 31237 代理人: 鄭瑋
地址: 200240 *** 國省代碼: 上海;31
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 文本 過濾 系統(tǒng) 方法
【權(quán)利要求書】:

1.一種文本過濾系統(tǒng),至少包括:

過濾模型建立模組,用于根據(jù)用戶的過濾需求建立過濾模型;

自適應(yīng)學(xué)習(xí)模組,通過對一組過濾樣本進行訓(xùn)練,形成接近用戶的過濾需求的本體庫;以及

文本過濾模組,抽取待過濾文本的特征詞,然后識別特征詞中的實體,并進行實體關(guān)系的抽取,形成待過濾文本的實體關(guān)系對向量,計算過濾模型與待過濾文本的相似度,對高于相似度閾值的文本進行過濾。

2.如權(quán)利要求1所述的一種文本過濾系統(tǒng),其特征在于:該過濾模型建立模組首先根據(jù)用戶的過濾需求,明確要構(gòu)建的本體所覆蓋的領(lǐng)域和范圍確定本體的領(lǐng)域與范圍,然后在本體所涉及的領(lǐng)域范圍內(nèi)進行信息的收集和分析,明確重點概念和概念之間的關(guān)系,并且用精確的術(shù)語表達出來,最后建立本體框架。

3.如權(quán)利要求2所述的一種文本過濾系統(tǒng),其特征在于:該本體采取三元組Topic(C,P,S)來表示,其中C表示由過濾領(lǐng)域內(nèi)的名詞概念抽象出來,具有相同屬性和行為結(jié)構(gòu)的概念類的集合,采用向量空間模型來表示;P描述概念和關(guān)系的屬性;S表示類之間的結(jié)構(gòu)關(guān)系。

4.如權(quán)利要求1所述的一種文本過濾系統(tǒng),其特征在于:該自適應(yīng)學(xué)習(xí)模組用增量式迭代方法對該組過濾樣本進行訓(xùn)練。

5.如權(quán)利要求1所述的一種文本過濾系統(tǒng),其特征在于,該文本過濾模組還包括:

預(yù)處理模組,對待過濾文本進行去除停用詞等預(yù)處理操作;

特征詞抽取模組,將經(jīng)過預(yù)處理的待過濾文本抽取出表達文本內(nèi)容的特征向量;

實體關(guān)系抽取模組,首先根據(jù)所抽取的頁面的特征向量,識別實體,并基于啟發(fā)式規(guī)則,獲取實體的上下文特征,然后構(gòu)建上下文特征詞的特征向量,采用應(yīng)用特征頻度函數(shù)對特征項進行數(shù)值化,采用k-means的聯(lián)合聚類算法,來實現(xiàn)實體對的聚類,最后對實體對的關(guān)系進行標(biāo)注;以及

相似度計算模組,計算待過濾文本與過濾模型的相似度,對高于相似度閾值的文本進行過濾。

6.如權(quán)利要求5所述的一種文本過濾系統(tǒng),其特征在于:該相似度計算模組根據(jù)向量空間模型,將兩特征向量夾角的余弦值表示它們的相似度,計算出待過濾文本與過濾模型的相似度,根據(jù)設(shè)定的閾值,將超過閾值的文本過濾掉。

7.一種文本過濾方法,包括如下步驟:

步驟一,根據(jù)用戶的過濾需求建立過濾模型;

步驟二,通過對一組過濾樣本進行訓(xùn)練,形成接近用戶的過濾需求的本體庫;以及

步驟三,抽取待過濾文本的特征詞,然后識別特征詞中的實體,并進行實體關(guān)系的抽取,形成待過濾文本的實體關(guān)系對向量,計算過濾模型與待過濾文本的相似度,對高于相似度閾值的文本進行過濾。

8.如權(quán)利要求7所述的一種文本過濾方法,其特征在于,步驟三包括如下步驟:

對待過濾文本進行去除停用詞等預(yù)處理操作;

將經(jīng)過預(yù)處理的待過濾文本抽取出表達文本內(nèi)容的特征向量;

進行實體關(guān)系的抽取,形成待過濾文本的實體關(guān)系對向量;以及

計算待過濾文本與過濾模型的相似度,對高于相似度閾值的文本進行過濾。

9.如權(quán)利要求8所述的一種文本過濾方法,其特征在于,該實體關(guān)系的抽取步驟還包括如下步驟:

首先根據(jù)所抽取的頁面的特征向量,識別實體;

基于啟發(fā)式規(guī)則,獲取實體的上下文特征;

構(gòu)建上下文特征詞的特征向量,采用應(yīng)用特征頻度函數(shù)對特征項進行數(shù)值化;

采用k-means的聯(lián)合聚類算法,來實現(xiàn)實體對的聚類;以及

對實體對的關(guān)系進行標(biāo)注。這樣待過濾文本就采用標(biāo)注過關(guān)系的實體對及關(guān)系的向量來表示。

10.如權(quán)利要求7所述的一種文本過濾方法,其特征在于,步驟一還包括如下步驟:

根據(jù)用戶的過濾需求,明確要構(gòu)建的本體所覆蓋的領(lǐng)域和范圍確定本體的領(lǐng)域與范圍;

在本體所涉及的領(lǐng)域范圍內(nèi)進行信息的收集和分析,明確重點概念和概念之間的關(guān)系,并且用精確的術(shù)語表達出來;以及

建立本體框架。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會員可以免費下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海電機學(xué)院,未經(jīng)上海電機學(xué)院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201210553556.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實用新型專利、外觀設(shè)計專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關(guān)于我們 尋求報道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 十八无遮挡| 欧洲国产一区| 久久国产精品-国产精品| 二区三区免费视频| 国产精品一区二区久久乐夜夜嗨| 99久久婷婷国产亚洲终合精品| 欧美日韩精品在线播放| 亚洲精品人| 日本午夜影视| 国产在线不卡一区| 亚洲国产精品区| 久久综合狠狠狠色97| 国产69精品久久久久按摩| 亚洲午夜精品一区二区三区电影院 | 午夜电影理伦片2023在线观看| 国产日韩欧美网站| 国产韩国精品一区二区三区| 亚洲欧洲一二三区| 色一情一交一乱一区二区三区| 精品国产一区二区三| 亚洲精品无吗| 99精品久久久久久久婷婷| 国产99网站| 久久综合久久自在自线精品自| 国产一区日韩在线| 久久激情综合网| 中文字幕在线一区二区三区| 91麻豆精品国产91久久久资源速度| 日本一二三区视频| 欧美亚洲另类小说| 亚洲w码欧洲s码免费| 91一区在线| 亚洲乱码一区二区| 久久福利免费视频| 国产午夜三级一区二区三| 国产一区第一页| 亚洲久色影视| free性欧美hd另类丰满| 国内揄拍国产精品| 欧美一区二区三区久久| 亚洲精品久久久久一区二区| 一区二区久久精品| 精品国产一区二区在线| 国产午夜亚洲精品羞羞网站 | 久久国产欧美一区二区三区免费| 精品无人国产偷自产在线| 国产欧美日韩另类| 免费xxxx18美国| 香港日本韩国三级少妇在线观看| 97精品久久人人爽人人爽| 欧美日韩久久一区二区| 淫片免费看| 亚洲国产99| 国产一区第一页| 日韩av在线中文| 精品久久久久久中文字幕| 久久婷婷国产香蕉| 国产在线一区不卡| 精品一区二区三区影院| 欧美性受xxxx狂喷水| 亚洲综合日韩精品欧美综合区| 亚洲精品久久久久玩吗| 99三级视频| 欧美精品粉嫩高潮一区二区| 久久99中文字幕| 亚洲欧美精品suv| 中文字幕日韩一区二区| 国产亚洲精品久久久久动| 视频一区欧美| 精品欧美一区二区在线观看| 欧美日韩精品影院| 91精品久久久久久综合五月天| 处破大全欧美破苞二十三| 欧美极品少妇| 免费久久99精品国产婷婷六月| 亚洲国产一区二| 一色桃子av大全在线播放| 欧美午夜羞羞羞免费视频app| 久久综合国产精品| 国产精品视频一区二区三| 在线国产一区二区| 中文字幕二区在线观看|