日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專(zhuān)利]一種用于子話題劃分的誘導(dǎo)劃分方法有效

專(zhuān)利信息
申請(qǐng)?zhí)枺?/td> 201710587046.1 申請(qǐng)日: 2017-07-18
公開(kāi)(公告)號(hào): CN107391660B 公開(kāi)(公告)日: 2021-05-11
發(fā)明(設(shè)計(jì))人: 續(xù)欣瑩;蘇婧瓊;鄒雪君;謝珺 申請(qǐng)(專(zhuān)利權(quán))人: 太原理工大學(xué)
主分類(lèi)號(hào): G06F16/35 分類(lèi)號(hào): G06F16/35;G06F40/289;G06K9/62
代理公司: 太原市科瑞達(dá)專(zhuān)利代理有限公司 14101 代理人: 盧茂春
地址: 030024 山西*** 國(guó)省代碼: 山西;14
權(quán)利要求書(shū): 查看更多 說(shuō)明書(shū): 查看更多
摘要:
搜索關(guān)鍵詞: 一種 用于 話題 劃分 誘導(dǎo) 方法
【說(shuō)明書(shū)】:

一種用于子話題劃分的改進(jìn)誘導(dǎo)劃分,屬于文本語(yǔ)義分析技術(shù)與全覆蓋粒計(jì)算的交叉領(lǐng)域,它包含如下步驟:1)利用LDA主題模型對(duì)語(yǔ)料庫(kù)建模,對(duì)“文檔?主題”矩陣設(shè)定合適的閾值;2)利用全覆蓋粒計(jì)算模型表征文本,結(jié)合全覆蓋粒約簡(jiǎn)的方法,刪除冗余覆蓋元;3)通過(guò)改進(jìn)誘導(dǎo)劃分算法對(duì)覆蓋元中具有相同鄰域系統(tǒng)的元素進(jìn)行重新組合,尋找誘導(dǎo)等價(jià)類(lèi),實(shí)現(xiàn)子話題劃分。本發(fā)明克服了目前子話題劃分的已有方法存在的問(wèn)題,為研究子話題劃分提供了一種新的有效方法。

技術(shù)領(lǐng)域

本發(fā)明屬于文本語(yǔ)義分析技術(shù)與全覆蓋粒計(jì)算的交叉領(lǐng)域,具體涉及文本的子話題劃分與全覆蓋粒計(jì)算模型,尤其涉及誘導(dǎo)劃分和改進(jìn)誘導(dǎo)劃分方法在子話題劃分中的應(yīng)用。

背景技術(shù)

在當(dāng)今網(wǎng)絡(luò)信息規(guī)模急劇膨脹的時(shí)代,用戶(hù)很難在海量的大數(shù)據(jù)信息中快速、準(zhǔn)確地獲得感興趣的、有用的新聞話題。對(duì)于同一個(gè)話題,事件往往是從多個(gè)角度、多個(gè)側(cè)面進(jìn)行描述與分析,僅僅通過(guò)這些孤立的信息,用戶(hù)無(wú)法全面的了解和掌握某個(gè)話題下的報(bào)道。例如,對(duì)于“2012倫敦奧運(yùn)”這一話題,各大新聞網(wǎng)站涉及了“各國(guó)備戰(zhàn)奧運(yùn)”、“奧運(yùn)圣火傳遞”、“奧運(yùn)隊(duì)服”、“獎(jiǎng)牌狀況”等多個(gè)事件,但是并沒(méi)有對(duì)這些報(bào)道進(jìn)行相關(guān)的分類(lèi)與整理,使人們不能很快的分類(lèi)瀏覽該話題下的各個(gè)專(zhuān)題。

針對(duì)文本語(yǔ)義分析技術(shù),專(zhuān)家學(xué)者們分別提出了一系列的解決方法,但是在解決子話題劃分這一關(guān)鍵問(wèn)題上,這些方法仍存在一些問(wèn)題,主要有:

1)雖然現(xiàn)在有很多學(xué)者采用LDA主題模型,但是該模型提取出的隱含主題粒度太大,不能較好的區(qū)別同一話題下的子話題。

2)在文本表征方面,大多數(shù)都采用傳統(tǒng)的VSM模型,但是該模型是從統(tǒng)計(jì)的角度進(jìn)行歸納的,缺乏文本的語(yǔ)義信息,使最終的結(jié)果準(zhǔn)確度較低。

由此可見(jiàn),現(xiàn)有的子話題劃分方法在話題粒度、文本表征等方面存在問(wèn)題,尚無(wú)法準(zhǔn)確解決子話題劃分這一問(wèn)題。

發(fā)明內(nèi)容

本發(fā)明提供劃分結(jié)果準(zhǔn)確性高的一種用于子話題劃分的誘導(dǎo)劃分方法。

本發(fā)明的技術(shù)方案:1、一種用于子話題劃分的誘導(dǎo)劃分方法,其特征在于包括下述內(nèi)容:

(1)文本預(yù)處理:即從新聞?wù)Z料庫(kù)中隨機(jī)挑選某一熱點(diǎn)話題若干篇,進(jìn)行人工標(biāo)注,并采用ICTCLAS系統(tǒng)對(duì)文檔進(jìn)行分詞和去停用詞;

(2)LDA主題建模對(duì)語(yǔ)料庫(kù)進(jìn)行建模:即采用Gibbs抽樣算法,提取語(yǔ)料庫(kù)中的隱含主題,得到“文檔-主題”矩陣θ,對(duì)矩陣θ設(shè)定閾值δ,δ為0~1的任意小數(shù);

(3)全覆蓋粒計(jì)算的知識(shí)約簡(jiǎn):利用全覆蓋粒計(jì)算模型表征設(shè)置閾值δ后的矩陣θ,用粒計(jì)算的方法將冗余話題刪除,將詞項(xiàng)空間表達(dá)的文檔約簡(jiǎn)為主題空間的低維表達(dá),從而達(dá)到了降維的目的;

(4)誘導(dǎo)劃分:將刪除冗余覆蓋元之后的結(jié)果作為誘導(dǎo)劃分的輸入,通過(guò)誘導(dǎo)劃分方法或改進(jìn)的誘導(dǎo)劃分方法,得到誘導(dǎo)等價(jià)類(lèi),從而實(shí)現(xiàn)誘導(dǎo)劃分;

(5)子話題劃分:將誘導(dǎo)等價(jià)類(lèi)中的每一類(lèi)作為一個(gè)子話題,誘導(dǎo)等價(jià)類(lèi)中集合的個(gè)數(shù)對(duì)應(yīng)子話題的個(gè)數(shù),將同一集合中的文檔劃分為同一個(gè)子話題,實(shí)現(xiàn)語(yǔ)料庫(kù)中新聞文檔的子話題劃分。

文檔中主題的概率ρδ時(shí),δ為0~1的任意小數(shù),矩陣θ為1,文檔中主題的概率ρ<δ時(shí),矩陣θ為0。

所述誘導(dǎo)劃分方法是:

步驟1:確定論域和覆蓋元;

步驟2:將全覆蓋中的覆蓋元兩兩之間進(jìn)行交運(yùn)算和對(duì)稱(chēng)差運(yùn)算;

步驟3:判斷步驟1中產(chǎn)生的集合是否為全覆蓋中已有的覆蓋元;

步驟4:若是,則不做任何處理,繼續(xù)進(jìn)行其它覆蓋元的運(yùn)算;若不是,將產(chǎn)生的集合加入全覆蓋中,作為一個(gè)新的覆蓋元,并且與其它覆蓋元之間進(jìn)行交運(yùn)算和對(duì)稱(chēng)差運(yùn)算;

下載完整專(zhuān)利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于太原理工大學(xué),未經(jīng)太原理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201710587046.1/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。

×

專(zhuān)利文獻(xiàn)下載

說(shuō)明:

1、專(zhuān)利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專(zhuān)利說(shuō)明書(shū);

2、支持發(fā)明專(zhuān)利 、實(shí)用新型專(zhuān)利、外觀設(shè)計(jì)專(zhuān)利(升級(jí)中);

3、專(zhuān)利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專(zhuān)利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級(jí)為極速版,下載速度顯著提升!歡迎使用!

請(qǐng)您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊(cè)】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識(shí) 聯(lián)系我們

鉆瓜專(zhuān)利網(wǎng)在線咨詢(xún)

周一至周五 9:00-18:00

咨詢(xún)?cè)诰€客服咨詢(xún)?cè)诰€客服
tel code back_top
主站蜘蛛池模板: 亚洲国产欧美一区二区丝袜黑人| 午夜少妇性影院免费观看| 色午夜影院| 97人人添人人爽一区二区三区| 欧美亚洲视频二区| 欧美一区二区综合| 久久一级精品| 视频一区欧美| 亚洲第一区国产精品| 精品99免费视频| 国产一区二区三区国产| 久久国产欧美一区二区三区精品| 欧美一区二区三区艳史| 久久一级精品视频| 久久精视频| 亚日韩精品| 国产一级一区二区| 亚洲国产精品肉丝袜久久| 午夜免费一级片| 久久网站精品| 性国产videofree极品| 国产亚洲精品久久网站| 国产精品v欧美精品v日韩精品v| 久久精品亚洲精品国产欧美| 韩漫无遮韩漫免费网址肉| 国产精品视频久久久久久| 热久久一区二区| 国91精品久久久久9999不卡| 国产高清在线精品一区二区三区| 91久久国产露脸精品国产| 91麻豆精品国产91久久久资源速度| 十八无遮挡| 午夜看大片| 亚洲国产美女精品久久久久∴| 国产九九九精品视频| 香港三日本8a三级少妇三级99 | 一区不卡av| 国产精品一区二区在线观看| 日韩区欧美久久久无人区| 国产欧美一二三区| 日韩av在线网| 国产女人和拘做受视频免费| 日韩精品免费一区二区中文字幕 | 国产69精品久久久久久久久久| 91精品国产综合久久国产大片 | 欧美一区二区三区国产精品| 国产精品一区二区免费视频| 国产理论片午午午伦夜理片2021 | 色综合久久88| 99re热精品视频国产免费| 99久久久国产精品免费调教网站| 狠狠插狠狠爱| 久久久精品欧美一区二区| 97久久精品一区二区三区观看| 午夜特级片| 国产在线播放一区二区| 亚洲一区二区三区加勒比| 国产天堂一区二区三区| 国产91丝袜在线熟| 91精品资源| 久久96国产精品久久99软件| 午夜激情看片| 欧美日韩国产123| 欧美精品在线视频观看| 国产精品伦一区二区三区在线观看| 欧美激情午夜| 日本高清一二三区| 91婷婷精品国产综合久久| 日韩一区二区精品| 久久一级精品视频| 美女张开腿黄网站免费| 国产精品一区二区免费| 538国产精品| 美日韩一区| 日韩精品福利片午夜免费观看| 欧美一区二区三区免费视频| 偷拍久久精品视频| 狠狠干一区| 玖玖玖国产精品| 97久久超碰国产精品| 亚洲国产精品日韩av不卡在线| 伊人av综合网|