日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種基于復(fù)雜網(wǎng)絡(luò)的博客關(guān)鍵詞提取方法在審

專利信息
申請?zhí)枺?/td> 201510368622.4 申請日: 2015-06-29
公開(公告)號: CN104933032A 公開(公告)日: 2015-09-23
發(fā)明(設(shè)計)人: 屈鴻;王曉斌;吳詩雯;馮旻昱;馮魯橋 申請(專利權(quán))人: 電子科技大學
主分類號: G06F17/27 分類號: G06F17/27;G06F17/30
代理公司: 成都弘毅天承知識產(chǎn)權(quán)代理有限公司 51230 代理人: 楊保剛;徐金瓊
地址: 611731 四川省*** 國省代碼: 四川;51
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 一種 基于 復(fù)雜 網(wǎng)絡(luò) 博客 關(guān)鍵詞 提取 方法
【權(quán)利要求書】:

1.一種基于復(fù)雜網(wǎng)絡(luò)的博客關(guān)鍵詞提取方法,其特征在于,如下步驟:

(1)通過爬蟲獲取博客文本;

(2)對爬蟲獲取的博客文本進行預(yù)處理,即得到已斷句、分詞和無停用詞的格式規(guī)范的博客文本;

(3)對博客文本進行預(yù)處理后,將博客文本中單詞之間的相鄰關(guān)系對應(yīng)于博客文本網(wǎng)絡(luò)節(jié)點之間的連接關(guān)系,根據(jù)博客文本中單詞之間的相鄰關(guān)系進行網(wǎng)絡(luò)模型構(gòu)建;

(4)根據(jù)博客文本中單詞之間的相鄰關(guān)系進行網(wǎng)絡(luò)模型構(gòu)建后,運用節(jié)點拓撲性質(zhì)制定節(jié)點重要性指標計算公式,節(jié)點的重要性是指節(jié)點的度和節(jié)點的介數(shù);

(5)根據(jù)節(jié)點重要性指標計算公式提取對博客文本進行預(yù)處理后的博客文本中的關(guān)鍵詞;

(6)輸出提取的對博客文本進行預(yù)處理后的博客文本中的關(guān)鍵詞。

2.根據(jù)權(quán)利要求1所述的一種基于復(fù)雜網(wǎng)絡(luò)的博客關(guān)鍵詞提取方法,其特征在于,所述步驟(2)中,對爬蟲獲取的博客文本進行預(yù)處理的具體步驟如下:

(21)文本規(guī)范化,即將其他格式的博客文本轉(zhuǎn)化成標準的txt格式進行關(guān)鍵詞的提取;

(22)斷句、分詞處理,即根據(jù)博客文本中標點符號以及單詞與單詞之間的空格進行單詞與短語的分割;

(23)大小寫變換,即將斷句、分詞處理后的博客文本中的大寫字母全部改為小寫字母;

(24)詞態(tài)變換,即將大小寫變換后的博客文本中存在英文單詞的,將英文單詞統(tǒng)一變換成該單詞的原型模式;

(25)去停用詞,即預(yù)先收集好停用詞,實驗中去除這些停用詞,減少無關(guān)詞的干擾,提高關(guān)鍵詞提取的準確率。

3.根據(jù)權(quán)利要求1所述的一種基于復(fù)雜網(wǎng)絡(luò)的博客文本關(guān)鍵詞提取方法,其特征在于,所述步驟(3)中,根據(jù)博客文本中單詞之間的相鄰關(guān)系進行網(wǎng)絡(luò)模型構(gòu)建的具體步驟如下:

(31)對經(jīng)過預(yù)處理后的博客文本的單詞進行標號,標號對應(yīng)于構(gòu)建的博客文本中單詞網(wǎng)絡(luò)的節(jié)點編號,網(wǎng)絡(luò)的節(jié)點編號是根據(jù)阿拉伯數(shù)字順序增長進行標記,同一個單詞有且僅有一個標號;

(32)根據(jù)博客文本中單詞之間的位置關(guān)系構(gòu)建單詞網(wǎng)絡(luò),若兩個單詞是相鄰的,那么這兩個單詞在網(wǎng)絡(luò)中對應(yīng)標號的節(jié)點之間則增加一條連邊,否則這兩個單詞在網(wǎng)絡(luò)中對應(yīng)標號的節(jié)點之間則不增加連邊;

(33)根據(jù)步驟(31)和步驟(32)遍歷博客文本中的單詞,得到網(wǎng)絡(luò)模型。

4.根據(jù)權(quán)利要求1所述的一種基于復(fù)雜網(wǎng)絡(luò)的博客關(guān)鍵詞提取方法,其特征在于,所述步驟(4)中,運用節(jié)點拓撲性質(zhì)制定節(jié)點重要性指標計算公式的具體步驟如下:

(41)計算構(gòu)建的網(wǎng)絡(luò)模型的每一個節(jié)點的度和節(jié)點的介數(shù);

(42)通過計算的節(jié)點的度和節(jié)點的介數(shù),對比PageRank算法,制定出節(jié)點重要性計算公式。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會員可以免費下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于電子科技大學,未經(jīng)電子科技大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201510368622.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實用新型專利、外觀設(shè)計專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關(guān)于我們 尋求報道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 日韩av在线播| 欧美大片一区二区三区| 国产一区二三| 91国产在线看| 日韩av在线电影网| 免费毛片a| 国产午夜精品一区二区三区最新电影| 精品国产鲁一鲁一区二区三区| 国产精品自拍在线观看| 欧美一区二粉嫩精品国产一线天| 日韩一区二区中文字幕| 99久久精品免费视频| xxxx国产一二三区xxxx| 午夜码电影| 久久99国产精品久久99| 久久久久国产精品免费免费搜索| 免费**毛片| 欧美性猛交xxxxxⅹxx88| 国产在线播放一区二区| 欧美精品在线一区二区| 香港三日本8a三级少妇三级99 | 北条麻妃久久99精品| 国产女人和拘做受在线视频| 亚洲欧美制服丝腿| 一区二区三区国产欧美| 精品国产亚洲一区二区三区| 国产欧美一区二区精品性| 欧美精选一区二区三区| 在线中文字幕一区| 国产精品视频二区不卡| 性old老妇做受| 国产亚洲另类久久久精品| 欧美高清视频一区二区三区| 精品一区二区三区中文字幕| 国产日韩欧美专区| 日韩av中文字幕在线免费观看| 丰满岳乱妇bd在线观看k8| 免费毛片a| 国内少妇自拍视频一区| 亚洲欧美一二三| 国产精品一区二区av日韩在线| 91国偷自产中文字幕婷婷| 视频国产一区二区| 日韩欧美一区精品| 欧美日韩乱码| 欧美乱妇高清无乱码| 亚洲国产一二区| 国产一区二区三区黄| 午夜国产一区二区三区| 久久五月精品| 国产欧美一区二区在线观看| 97人人澡人人爽91综合色| 狠狠综合久久av一区二区老牛| 日韩av免费电影| 99久久国产综合精品色伊| 李采潭无删减版大尺度| 国产农村妇女精品一区二区| 日韩精品一区二区三区在线 | 538在线一区二区精品国产| 97午夜视频| 久久久久久亚洲精品中文字幕| 国产大片一区二区三区| 久久精品一区二区三区电影| 国产精品99一区二区三区| 国产高清精品一区二区| 国产一级一区二区三区| 人人澡超碰碰97碰碰碰| 一级女性全黄久久生活片免费| 久久精品一二三四| 国产91一区二区在线观看| 色噜噜狠狠狠狠色综合久| 欧美乱妇在线观看| 午夜影院啊啊啊| 午夜影院毛片| 国产欧美二区| 久久久久久久亚洲视频| 亚洲精品久久久久中文字幕欢迎你 | 国产精品对白刺激在线观看| 久久久久亚洲精品视频| 国产精品久久二区| 精品国产一区二区在线| 午夜黄色一级电影|