日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種用于中文新聞突發(fā)事件的文本分類與抽取方法有效

專利信息
申請?zhí)枺?/td> 201811202156.2 申請日: 2018-10-16
公開(公告)號: CN109299266B 公開(公告)日: 2019-11-12
發(fā)明(設(shè)計(jì))人: 滕輝;龍飛 申請(專利權(quán))人: 中國搜索信息科技股份有限公司
主分類號: G06F16/35 分類號: G06F16/35;G06F16/9537
代理公司: 北京市盛峰律師事務(wù)所 11337 代理人: 于國富
地址: 100000 北京市大興*** 國省代碼: 北京;11
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 抽取 突發(fā)事件 文本分類 預(yù)先定義事件 自然語言處理 分類準(zhǔn)確率 詞匯詞性 基于事件 快速分析 內(nèi)容信息 實(shí)例驅(qū)動(dòng) 數(shù)據(jù)稀疏 新聞文本 信息缺失 輿情分析 傳統(tǒng)的 詞向量 短文本 貢獻(xiàn)度 中文 詞性 權(quán)重 算法 向量 失衡 文本 分類 融入 聯(lián)合
【說明書】:

本發(fā)明公開了一種用于中文新聞突發(fā)事件的文本分類與抽取方法,屬于自然語言處理領(lǐng)域。本發(fā)明針對新聞文本分類,采用了基于對標(biāo)題和內(nèi)容信息的聯(lián)合表征,并將詞性對文本分類的貢獻(xiàn)度融入到傳統(tǒng)的TF?IDF算法中,并作為Word2Vec詞向量的權(quán)重進(jìn)一步生成短文本向量,從而避免了因單一利用標(biāo)題或內(nèi)容引起的信息缺失和文本詞匯詞性重要性不同而導(dǎo)致的分類準(zhǔn)確率降低的問題;最后,采用基于事件實(shí)例驅(qū)動(dòng)的新聞突發(fā)事件的抽取方法抽取事件實(shí)例,不僅克服了正反例失衡以及數(shù)據(jù)稀疏問題,而且解決了預(yù)先定義事件類別的局限性,實(shí)現(xiàn)了事件抽取,方便新聞工作人員、輿情分析人員進(jìn)一步利用事件抽取結(jié)果快速分析新聞。

技術(shù)領(lǐng)域

本發(fā)明涉及自然事件處理領(lǐng)域,尤其涉及一種用于中文新聞突發(fā)事件的文本分類與抽取方法。

背景技術(shù)

近年來,網(wǎng)絡(luò)新聞快速發(fā)展,相比于傳統(tǒng)媒體新聞,網(wǎng)絡(luò)新聞更加快速、靈活且便捷,網(wǎng)絡(luò)新聞也日漸成為人們獲取新聞資訊的一種最普遍方式。利用文本分類技術(shù)自動(dòng)地對大量新聞進(jìn)行快速的分類,以及在保證原始新聞主要內(nèi)容的前提下,如何有效的抽取新聞中的事件,是當(dāng)前研究的主要困難。新聞文本分類以及事件提取在信息提取領(lǐng)域一直是極具挑戰(zhàn)性的問題,涉及自然語言處理、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)等多個(gè)學(xué)科的技術(shù)和方法,在自動(dòng)摘要、信息檢索等領(lǐng)域有著廣泛的需求和應(yīng)用前景。首先,利用向量空間模型,對新聞標(biāo)題以及內(nèi)容進(jìn)行向量量化表示,構(gòu)建特征矩陣,利用基于余弦相似度和機(jī)器學(xué)習(xí)分類器對新聞進(jìn)行分類。進(jìn)一步,利用事件抽取算法對已經(jīng)分類好的數(shù)據(jù)集進(jìn)行事件提取。

現(xiàn)有的技術(shù)文獻(xiàn)中,發(fā)明專利“一種基于文體和詞表的突發(fā)事件信息抽取方法及系統(tǒng)”,公開號為201711343022.8,采用詞表進(jìn)行事件分類,采用文體特征進(jìn)行時(shí)間、事件摘要的抽取。這種基于觸發(fā)詞和事件元素的匹配方法依賴于具體領(lǐng)域及文本格式,且基于觸發(fā)詞的事件抽取方法會(huì)引入大量的反例,造成正反例失衡且在語料庫規(guī)模較小時(shí)存在一定的數(shù)據(jù)稀疏。

發(fā)明內(nèi)容

本發(fā)明的目的在于提供一種用于中文新聞突發(fā)事件的文本分類與抽取方法,在對新聞文本進(jìn)行分類的基礎(chǔ)上,利用基于事件實(shí)例驅(qū)動(dòng)的事件抽取方法,對新聞進(jìn)行事件抽取,從而解決現(xiàn)有技術(shù)中存在的前述問題。

為了實(shí)現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案如下:

一種用于中文新聞突發(fā)事件的文本分類與抽取方法,主要包括以下步驟:

S1,利用爬蟲獲取多個(gè)新聞網(wǎng)站內(nèi)容作為初始新聞數(shù)據(jù)集,記為新聞數(shù)據(jù)集S={s1,s2,...,sN},其中,si為新聞數(shù)據(jù)集中第i個(gè)新聞文本,i=1,2,...,N,N為新聞數(shù)據(jù)集新聞文本總數(shù);

S2,對步驟S1中得到的新聞數(shù)據(jù)集S進(jìn)行分類,得到分類好的新聞數(shù)據(jù)集

S3,對已經(jīng)分類好的新聞數(shù)據(jù)集進(jìn)行事件抽取。

優(yōu)選地,步驟S2主要包括以下步驟:

S21,提取新聞數(shù)據(jù)集S中的第一個(gè)新聞文本s1的標(biāo)題和正文,得到新聞文本s′1={t1,c1},其中t1為新聞文本s1的標(biāo)題,c1為新聞文本s1的標(biāo)題;

S22,遍歷新聞數(shù)據(jù)集S中的所有新聞文本,重復(fù)步驟S21,得到新聞數(shù)據(jù)集S′,其中,N為新聞數(shù)據(jù)集新聞文本總數(shù);

S23,提取所述新聞數(shù)據(jù)集S′中的新聞文本s′1的特征向量,得到新聞數(shù)據(jù)集特征矩陣

S24,使用支持向量機(jī)分類器對步驟S23得到的新聞數(shù)據(jù)集特征矩陣進(jìn)行分類,得到分類好的新聞數(shù)據(jù)集

優(yōu)選地,步驟S23主要包括以下步驟:

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國搜索信息科技股份有限公司,未經(jīng)中國搜索信息科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201811202156.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說明:

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖技術(shù)構(gòu)造圖;

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产精品刺激对白麻豆99 | 国产激情视频一区二区| 国产丝袜一区二区三区免费视频| 国产精品一区在线播放| 国产理论片午午午伦夜理片2021| 99国产精品永久免费视频| 91婷婷精品国产综合久久| 欧美精品国产一区| 欧美日韩国产影院| 91福利试看| 99久精品视频| 99日韩精品视频| 欧美一级日韩一级| 精品国产乱码一区二区三区a| 性生交大片免费看潘金莲| 91香蕉一区二区三区在线观看| 国产精品久久久久久久久久久新郎 | 亚洲一级中文字幕| 久久久一二区| 日韩午夜三级| 久久艹国产精品| 在线观看v国产乱人精品一区二区| 欧美日韩一级二级三级| 国产一二区在线观看| 狠狠色噜噜狠狠狠狠69| 26uuu亚洲国产精品| 日本午夜影视| 97人人澡人人添人人爽超碰| 亚洲精品乱码久久久久久写真| 国产99视频精品免费视频7| 97人人澡人人添人人爽超碰| 日韩精品免费一区二区中文字幕| 亚洲精品少妇一区二区| 精品国产一级| 视频一区二区三区中文字幕| 国产一区在线视频观看| 久久精品国语| 国产高清无套内谢免费| 欧美性二区| 99热久久精品免费精品| 国产欧美一区二区精品久久| 亚洲一二三在线| 国产一区二区三区精品在线| 久久久久国产一区二区三区不卡| 一区二区国产精品| 午夜av网址| 久久99精品国产麻豆婷婷洗澡| 久久天天躁夜夜躁狠狠躁2022| 久久精品爱爱视频| 久久人做人爽一区二区三区小说| 99国产精品9| 国产精品二区一区| 国产偷自视频区视频一区二区| 91国偷自产一区二区介绍| 在线观看黄色91| 婷婷嫩草国产精品一区二区三区| 中文字幕欧美久久日高清| 亚洲欧美日韩在线看| 久久精品一二三| 亚洲欧美一区二区精品久久久| 国产女人和拘做受视频免费| 在线国产一区二区三区| 久久精品国产亚洲一区二区| 99久久精品国| 国产午夜精品一区二区三区在线观看 | 久久99中文字幕| 91麻豆精品国产91久久久更新时间| 精品久久一区| 国内少妇偷人精品视频免费| 精品国产二区三区| 国产免费一区二区三区四区| 国产精品久久久久久久久久久久久久不卡| 国产高清在线一区| 国产精品久久久久久亚洲美女高潮| 国产精品视频一区二区三| 国产日韩欧美一区二区在线播放| 日韩精品免费播放| 欧美日韩精品中文字幕| 免费午夜片| 国产精品一区二区不卡| 精品久久综合1区2区3区激情| 香港三日本8a三级少妇三级99| 欧美乱妇高清无乱码| 日韩一级视频在线| 国产一区二区三区中文字幕| 国产99久久九九精品免费| 99国产精品丝袜久久久久久| 国产精品日韩一区二区| 久久99国产综合精品| 视频国产一区二区| 91精品夜夜| 99日韩精品视频| 久久精品爱爱视频| 欧美精品一卡二卡| 精品国产一区二区三区在线| 狠狠色噜噜狠狠狠狠综合久| 国产精品69久久久| 91麻豆精品国产自产欧美一级在线观看| 久久精品男人的天堂| 中文字幕欧美日韩一区| 91麻豆精品国产91久久久资源速度| 日韩精品一区二区三区四区在线观看| 午夜av男人的天堂| 国产亚洲精品久久网站| 一区二区精品在线| 亚洲乱小说| 国产精品亚洲精品一区二区三区| 欧美日韩久久一区| 91久久国产露脸精品国产| 99久久国产综合精品色伊| 午夜av电影院| 99国产精品九九视频免费看| 日韩精品一二区| 日韩精品久久久久久久的张开腿让 | 午夜精品在线播放| 欧美激情在线观看一区| 老太脱裤子让老头玩xxxxx| 日韩精品中文字幕在线| 欧美一区二区三区精品免费| 国产91久| 四虎精品寂寞少妇在线观看| 欧美一区二区三区激情在线视频| 欧美一区二区精品久久| 狠狠躁夜夜躁xxxxaaaa| 精品国产一区二区三区久久久久久 | 91热精品| 狠狠色综合久久丁香婷婷| 日本一区二区免费电影| 日韩久久精品一区二区| 538国产精品一区二区免费视频| 国产伦高清一区二区三区| 日韩中文字幕区一区有砖一区| 中文乱码字幕永久永久电影| 日韩欧美一区二区在线视频| 99久久国产免费,99久久国产免费大片| 亚洲日韩aⅴ在线视频| 91视频一区二区三区| 一级久久久| 国产特级淫片免费看| 亚洲精品国产精品国自| 91精品国产高清一二三四区| 午夜私人影院在线观看| a级片一区| 九九热国产精品视频| 久久久精品欧美一区二区| 日韩一区免费| 99久久夜色精品国产网站| 亚洲欧美一区二| 国产精品一区在线观看你懂的| 亚洲制服丝袜在线| 精品一区二区三区影院| 久久激情网站| 久久久久久久亚洲国产精品87| 狠狠色噜噜狠狠狠狠黑人| 日韩av中文字幕在线免费观看| 欧美片一区二区| 国产1区2区3区| 日韩午夜电影在线| 国产一区网址| 精品国产九九| 久久激情影院| 丰满岳乱妇在线观看中字| 玖玖爱国产精品| 一区二区三区欧美视频| ass韩国白嫩pics| 国产午夜精品av一区二区麻豆| 欧美日韩一级在线观看| 国产97免费视频| 久久一二区| 亚洲欧美日韩综合在线| 国产在线卡一卡二| 国产69精品久久99的直播节目| 国产高清一区在线观看| 少妇高潮在线观看| 性欧美一区二区三区| 91麻豆精品国产91久久久更新时间| 一区不卡av| 精品国产乱码久久久久久a丨| 日韩精品免费一区二区三区| 久久久久国产一区二区三区不卡| 国产伦精品一区二区三区免费迷| 91婷婷精品国产综合久久| 精品国产一区二| 午夜精品在线播放| 国产一区日韩一区| 丰满少妇高潮惨叫久久久| 国产日韩欧美精品一区二区| 国产资源一区二区| 欧美一区二区三区另类| 欧美一区二区精品久久911 | 中文字幕在线播放一区| 色噜噜狠狠狠狠色综合久| 热久久国产| 午夜色大片| 91精品婷婷国产综合久久竹菊 | 香港三日三级少妇三级99| 国产精品欧美一区二区三区奶水 | 91精品久久久久久久久久| 狠狠色狠狠色综合久久第一次| 99欧美精品| 国产经典一区二区三区| 日韩精品一区二区三区不卡| 99视频国产在线| 日本三级韩国三级国产三级| 97久久精品人人澡人人爽| xxxx18日本护士高清hd| 挺进警察美妇后菊| 性刺激久久久久久久久九色| 麻豆天堂网| 国产欧美日韩精品一区二区图片| 精品国产一区二区三| 性国产日韩欧美一区二区在线| 国产又黄又硬又湿又黄| 精品国产区| 亚洲欧美另类综合| 国产精品一区二区三| 性色av香蕉一区二区| 久久夜色精品久久噜噜亚| 中文字幕视频一区二区| 日韩欧美高清一区二区| 亚洲高清国产精品| 狠狠躁夜夜躁2020| 国产精品电影一区二区三区| 亚洲欧洲一区二区| 99精品偷拍视频一区二区三区 | 一级午夜影院| 国产一级一区二区| 一区精品二区国产| 精品国产品香蕉在线| 久久久久久久亚洲视频| 99精品黄色| 农村妇女精品一二区| 国语对白一区二区三区| 538国产精品| 99re久久精品国产| 精品一区在线观看视频| 国产日韩欧美91| 狠狠色噜噜狠狠狠狠米奇777| 中文字幕欧美一区二区三区 | 午夜看片网| 狠狠躁夜夜av| 亚洲精品乱码久久久久久国产主播| 日本精品一区二区三区视频| 国产麻豆精品久久| 国产在线精品一区| 中文乱幕日产无线码1区|