日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種基于萬有引力改進的TextRank的新聞關鍵詞提取方法在審

專利信息
申請號: 201910441723.8 申請日: 2019-05-24
公開(公告)號: CN110162592A 公開(公告)日: 2019-08-23
發明(設計)人: 張靜靜;孫福權;劉冰玉;孔超然 申請(專利權)人: 東北大學
主分類號: G06F16/31 分類號: G06F16/31;G06F16/35;G06F16/951;G06F17/27
代理公司: 大連東方專利代理有限責任公司 21212 代理人: 李馨
地址: 110819 遼寧*** 國省代碼: 遼寧;21
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 文檔 萬有引力 關鍵詞序列 新聞關鍵詞 新聞數據 預處理 數據預處理 分布計算 概率分布 計算數據 距離計算 模型訓練 時間成本 算法迭代 外部信息 主題模型 詞向量 構建 語料 預設 標注 排序 改進 采集
【說明書】:

本發明提供一種基于萬有引力改進的TextRank的新聞關鍵詞提取方法。本發明方法包括如下步驟:對采集到的新聞數據進行數據預處理;計算數據預處理后的新聞數據中詞與詞之間的共現頻率,并通過CBOW模型訓練詞向量,構建主題模型得到文檔中主題下詞的概率分布和文檔下主題的分布計算每篇文檔下預設詞的主題影響力;通過詞之間的共現頻率、詞在文檔下主題影響力和詞之間的距離計算出詞與詞之間的吸引力,利用TextRank算法迭代計算得到有序的關鍵詞序列,根據排序好的關鍵詞序列得到指定數量的關鍵詞。本發明充分的利用了文檔內部與外部信息,利用該發明提取出的關鍵詞更加準確,客觀。本方法不需要大量的標注語料,節省了大量的人力和時間成本。

技術領域

本發明涉及自然語言處理領域,尤其涉及一種基于萬有引力改進的TextRank的新聞關鍵詞提取方法。

背景技術

我們身處在一個信息爆炸的時代,接收信息方式具有多樣性,包括文本、圖像、音頻等,其中文本信息是信息傳播的重要途徑之一。由于數據的爆炸式增長,手工提取大量文本信息中的內容難上加難,需要大量的勞動力和專業人員才能夠實現對信息的準確提取。那么在這種需求的推動下,高效快速的獲取到文本中的主要信息成為了目前的熱點問題。

為了能在大量的新聞數據中獲取到主要信息內容,研究人員致力于文本分類、文本聚類和文本摘要等研究領域進行探索研究。而這些研究都會涉及到文本處理的基本技術問題--關鍵詞的提取。通過提取到的關鍵詞我們可以了解到文本的核心主題或者主要內容。關鍵詞的準確提取已經成了自然語言處理文本分析的熱點研究問題。關鍵詞提取技術目前應用領域廣泛,特別是在新聞服務領域發揮著重要作用。用戶通過新聞關鍵詞的提取,可以很快了解新聞主題或大致內容,從而判斷文章是否為其感興趣的內容。并且大量研究證明,關鍵詞提取在文本分類、文本摘要提取、文本聚類和信息檢索等方面發揮著重要作用。與此同時,由于文本信息的指數性增長,手動提取已不能滿足需求、需要借助高效的提取方法獲取到準確的、概括性強的關鍵詞。

關鍵詞是對文本的高度概括,通過對新聞文本數據的提取,用戶不僅能準確快速的獲取到新聞主要信息,而且在信息檢索中,可以通過搜索引擎搜索,快速獲取到相關關鍵詞的最相關文本,提高用戶體驗效果。因此關鍵詞提取在新聞領域有著至關重要的作用。

目前現有的關鍵詞提取算法主要有兩大類,分別是基于無監督的學習模式和有監督的學習模式。早期的無監督關鍵詞提取方法主要是訓練一個分類器,判斷所提出的詞是否為關鍵詞,但是這樣得到的關鍵詞它們的重要程度一樣,不具有區分性。基于這種的提取關鍵詞的方法有:決策樹、樸素貝葉斯、最大熵、支持向量機等機器學習方法。事實上,在每篇文檔中每個詞都具有不同的重要性,得到的不具有排序的關鍵詞不具有實用性。為此有人提出用有監督的方法來對關鍵詞進行提取,取得了不錯效果,但是基于有監督的學習需要大量的、高質量的標注語料,需要耗費大量的人力物力和大量時間。所以目前無監督提取關鍵詞的方法是主流方法,其不需要標注大量語料。但是現有的關鍵詞提取精度依舊不是很高。專利號為CN109614626A的《基于萬有引力模型的關鍵詞自動抽取方法》公開了一種萬有引力關鍵詞提取的算法,但是它采用改進的TF-IDF計算詞的質量,其融合單詞位置、詞性、詞長等外部特征。雖然基于TF-IDF統計特征簡單易行,但是該方法忽略了重要的低頻詞和文檔內部的主題分布語義特征。在提取關鍵詞時準確率依舊有待提高。

發明內容

根據上述提出的技術問題,而提供一種充分的考慮文檔中低頻詞和文檔內部主題分布的語義特征的基于萬有引力改進的TextRank的新聞關鍵詞提取方法。本發明采用的技術手段如下:

一種基于萬有引力改進的TextRank的新聞關鍵詞提取方法,包括如下步驟:

對采集到的新聞數據進行數據預處理,獲得用于分析的規整數據;

計算數據預處理后的新聞數據中詞與詞之間的共現頻率,并通過CBOW模型訓練詞向量,然后構建主題模型得到文檔中主題下詞的概率分布和文檔下主題的分布計算每篇文檔下預設詞的主題影響力;

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東北大學,未經東北大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201910441723.8/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 99久久免费精品国产免费高清| 夜夜躁日日躁狠狠躁| 欧美日韩一级二级三级| 日韩在线一区视频| 亚洲欧美一区二区三区三高潮| 亚洲va久久久噜噜噜久久0| 玖玖国产精品视频| 午夜免费一级片| 日韩av在线导航| 午夜欧美影院| 欧美一区视频观看| 欧美三级午夜理伦三级中视频 | 欧美极品少妇xx高潮| 少妇性色午夜淫片aaa播放5| 91精品国产综合久久婷婷香| 天摸夜夜添久久精品亚洲人成 | 91精品国产高清一二三四区| 日韩精品人成在线播放| 国产麻豆91欧美一区二区| 精品国产乱码一区二区三区在线 | 国产三级在线视频一区二区三区 | 精品一区二区超碰久久久| 欧美精品免费视频| 久久精品国产色蜜蜜麻豆| 99精品久久99久久久久| 一区二区三区国产精品视频| 中文字幕一区一区三区| 香港三日本8a三级少妇三级99| 国产资源一区二区三区| 蜜臀久久99静品久久久久久 | 午夜看片网| 日本午夜无人区毛片私人影院| 韩漫无遮韩漫免费网址肉| 一级女性全黄久久生活片免费| 久久久久国产精品视频| 国产真实一区二区三区| 午夜一区二区三区在线观看| 国产精品自拍在线| 国产一区免费在线观看| 国产理论一区二区三区| 91精品国产综合久久婷婷香| 精品国产一二三四区| 精品久久国产视频| 26uuu亚洲国产精品| 久久99国产综合精品| 欧美在线视频一区二区三区| 制服.丝袜.亚洲.另类.中文| 亚洲国产日韩综合久久精品| 亚洲精品国产主播一区| 午夜生活理论片| 午夜亚洲国产理论片一二三四| 亚洲第一天堂无码专区| 日本一区二区三区中文字幕| 二区三区视频| 96国产精品| 热久久一区二区| 日韩精品免费一区二区在线观看| 中文字幕一区2区3区| 国产片91| 久久一区欧美| 午夜肉伦伦| 一区二区欧美视频| 中文字幕一区二区三区乱码| 日韩av三区| 中文在线一区二区三区| 国产精品自拍不卡| 国产欧美日韩亚洲另类第一第二页| 亚洲精品日韩激情欧美| 午夜伦情电午夜伦情电影| 国产无遮挡又黄又爽免费网站| 欧美一级不卡| 91精品视频在线观看免费| 国产麻豆91欧美一区二区| 狠狠色丁香久久婷婷综| 欧美日韩国产一区二区三区在线观看| 7799国产精品久久99| 亚洲va国产2019| 欧美网站一区二区三区| 国产乱人伦精品一区二区| 国产精品爽到爆呻吟高潮不挺| 国产精品免费一区二区区| 精品国产乱码久久久久久图片| 在线国产一区二区| 福利片午夜| 蜜臀久久久久久999| 久久久久久久国产精品视频| 视频一区二区三区欧美| 国产99久久九九精品| 亚洲精品一品区二品区三品区| 欧美日韩一区在线视频| 91精品久久久久久久久久| 中文字幕a一二三在线| 亚洲一区中文字幕| 国产激情视频一区二区| 国产精品视频一区二区三| 欧美日韩一二三四区| 精品国产1区2区| 午夜黄色网址| 欧美一区二区伦理片| 亚洲精品久久久久玩吗| 狠狠色丁香久久婷婷综| 在线视频不卡一区| 国产黄色一区二区三区| 国产一级精品在线观看| 91狠狠操| 99久精品视频| 在线国产一区二区三区| 强制中出し~大桥未久4| 亚洲精品久久久中文| 亚洲欧美色图在线| 亚洲制服丝袜中文字幕| 久久99精| 亚洲精品卡一| 精品国产亚洲一区二区三区| 国产精品视频一二区| 精品久久久久久中文字幕| 欧美日韩一二三四区| 亚洲精品国产久| 国产网站一区二区| 欧美精品一区二区性色| 亚洲国产精品97久久无色| 亚洲自拍偷拍一区二区三区| 91超薄丝袜肉丝一区二区| 蜜臀久久99静品久久久久久| 久久综合久久自在自线精品自| 综合久久色| 国产白嫩美女在线观看| 97欧美精品| 美女张开腿黄网站免费| 久久aⅴ国产欧美74aaa| 欧美日韩亚洲三区| 狠狠色噜噜狠狠狠四色米奇| 国产精品国产三级国产专区53| 国产精品免费专区| 色婷婷精品久久二区二区6| 日本少妇一区二区三区| 亚洲三区二区一区| 欧美精品一区二区三区四区在线| 久久国产精品久久久久久电车| 中文字幕视频一区二区| 天天干狠狠插| 97国产婷婷综合在线视频,| 国产一区二区视频免费观看| 国产69精品久久99不卡免费版| 亚洲区日韩| 国产黄色一区二区三区| 狠狠插影院| 欧美日韩国产在线一区| 精品国产一区二区三区免费 | 午夜国产一区二区三区四区| 在线国产91| 亚洲欧美日韩精品suv| 毛片大全免费观看| 国产精品96久久久久久久| 99riav3国产精品视频| 国产一区欧美一区| 性少妇freesexvideos高清bbw| 国产呻吟久久久久久久92| 国产精品视频免费一区二区| xxxxhd欧美| 欧美在线观看视频一区二区| 欧美一区二区三区日本| 久久99国产精品视频| 国产91久久久久久久免费| 一区二区久久精品| 韩国女主播一区二区| 特级免费黄色片| 欧美久久久一区二区三区| 99国产午夜精品一区二区天美| 波多野结衣女教师电影| 国产大片一区二区三区| 91嫩草入口| 99精品久久99久久久久| 国产一级大片| 国产精品自拍在线观看| 国产伦精品一区二区三区免费下载| 国产日韩欧美精品| 久久久久一区二区三区四区 | 久久精品视频偷拍| 亚洲日韩aⅴ在线视频| 国产在线一卡| 欧美一级免费在线视频| 在线国产精品一区二区| 99爱精品视频| 欧美日韩国产免费观看| 国产一区在线精品| 少妇太爽了在线观看免费| 激情久久影院| 午夜电影一区二区| 午夜精品影视| 久久99精品一区二区三区| 国产精品香蕉在线的人| 久久精品亚洲精品| 99re6国产露脸精品视频网站| 国产欧美一区二区在线观看| 99国产精品99久久久久久粉嫩| 国产资源一区二区| 综合色婷婷一区二区亚洲欧美国产| 97久久国产精品| 亚洲午夜天堂吃瓜在线| 狠狠综合久久av一区二区老牛| 四虎国产精品永久在线国在线 | 免费毛片a| 欧美日韩久久一区二区| 国产理论片午午午伦夜理片2021 | 日韩av在线资源| 精品国产一区二区三区国产馆杂枝| 欧美日韩精品在线一区二区| 国产精品视频一区二区在线观看| 93精品国产乱码久久久| 国产精品亚洲二区| 国偷自产中文字幕亚洲手机在线| 午夜av片| 久久九九国产精品| 久久乐国产精品| 免费a级毛片18以上观看精品| 91久久久爱一区二区三区| 国产视频一区二区视频| 日本精品一区二区三区视频| 91精品资源| 欧美在线一区二区视频| 日韩a一级欧美一级在线播放| 国产精品亚洲精品| 国产精品一区二区在线观看 | 99久久国产综合精品麻豆| 日韩精品午夜视频| 午夜毛片在线观看| 挺进警察美妇后菊| 日韩精品乱码久久久久久| 国产精品白浆一区二区| 午夜特片网| 精品一区二区三区视频?| 精品国产九九| 97人人揉人人捏人人添| 右手影院av| xoxoxo亚洲国产精品| 99久久婷婷国产综合精品草原| 夜夜爽av福利精品导航| 国产特级淫片免费看| 亚洲国产视频一区二区三区| 欧美日韩国产在线一区二区三区| 一区二区三区国产精华| 91视频国产九色| 欧美国产精品久久| 国产精品九九九九九九| 国产一区二区三区影院|