日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種基于圖模型的無監(jiān)督自動文摘提取方法有效

專利信息
申請?zhí)枺?/td> 201911321569.7 申請日: 2019-12-20
公開(公告)號: CN111177365B 公開(公告)日: 2022-08-02
發(fā)明(設(shè)計)人: 趙衛(wèi)東;陳曉露;王銘 申請(專利權(quán))人: 山東科技大學(xué)
主分類號: G06F16/34 分類號: G06F16/34;G06F40/30;G06K9/62
代理公司: 青島智地領(lǐng)創(chuàng)專利代理有限公司 37252 代理人: 種艷麗
地址: 266590 山東*** 國省代碼: 山東;37
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 一種 基于 模型 監(jiān)督 自動 文摘 提取 方法
【說明書】:

發(fā)明公開了一種基于圖模型的無監(jiān)督自動文摘提取方法,屬自然語言處理領(lǐng)域。本發(fā)明使用TF?IDF模型得到樣本特征詞的IDF值,輸入到PV?IDF模型訓(xùn)練得到樣本句子向量;利用關(guān)鍵詞和句子位置等信息得到句子初始權(quán)重,生成懲罰矩陣;將句子初始權(quán)重輸入圖模型中初始化節(jié)點權(quán)重,句子向量相似度作為節(jié)點連線權(quán)重,迭代圖模型得到句子得分并排序;將得分前n個候選文摘句利用懲罰矩陣篩選,得到文摘句;使用PV?IDF模型訓(xùn)練句子向量計算相似度,初始化圖模型節(jié)點權(quán)重,并使用懲罰矩陣對文摘句進行篩選,解決了現(xiàn)有無監(jiān)督自動文摘方法語義相關(guān)度低,冗余度高的問題,在R1和RL指標(biāo)有了顯著的提高,有效提高了文摘質(zhì)量。

技術(shù)領(lǐng)域

本發(fā)明屬于自然語言處理領(lǐng)域,具體涉及一種基于圖模型的無監(jiān)督自動文摘提取方法。

背景技術(shù)

隨著大數(shù)據(jù)時代的到來,如何從海量的信息中快速準(zhǔn)確的提煉出關(guān)鍵信息已經(jīng)成為一個亟需解決的重要問題。文本摘要在新聞信息提取、科技文獻檢索、商品評論分析等領(lǐng)域都有重要應(yīng)用。隨著深度學(xué)習(xí)理論和方法的快速發(fā)展,已廣泛應(yīng)用于文本特征提取等自然語言處理領(lǐng)域。自動摘要可以從很多角度進行分類,按照有無監(jiān)督數(shù)據(jù)來劃分,可以分為有監(jiān)督和無監(jiān)督自動文摘方法。有監(jiān)督摘要方法需要從文件中選取主要內(nèi)容作為訓(xùn)練數(shù)據(jù),將文摘視為句子層面的分類問題,需要大量的注釋和標(biāo)簽數(shù)據(jù),會消耗大量的人力資源和時間成本。無監(jiān)督的文本摘要系統(tǒng)不需要任何監(jiān)督數(shù)據(jù),僅通過對文檔進行檢索即可形成摘要。但是目前的無監(jiān)督摘要沒有充分挖掘和利用語義之間的關(guān)系,對文檔數(shù)據(jù)利用不充分,文摘冗余度高,存在諸多局限性,為了解決無監(jiān)督自動文摘方法存在的主要問題,本發(fā)明提出了一種適用于中文文本摘要的自動提取算法。

目前,有關(guān)無監(jiān)督的自動文摘算法的研究有很多。其中,iTextRank算法在圖模型節(jié)點構(gòu)建時考慮引入標(biāo)題、段落、句子位置和長度等信息,有效提高了TextRank算法文摘質(zhì)量,但并未考慮文本語義信息。而DK-TextRank算法使用Doc2Vec訓(xùn)練句子向量,并使用K-means算法對句子向量進行聚類,該算法考慮了文章語義對文摘的影響,但首先使用K-means聚類會導(dǎo)致信息損失,某些文摘句在輸入圖模型之前就會被提前刪除。楊山等人使用Word2Vec模型訓(xùn)練詞向量,并利用句子中詞向量疊加求均值作為句子的向量表示,輸入TextRank圖模型進行迭代,該算法考慮使用了Word2Vec求均值的方法來表示含有語義信息的句子向量,但利用該方法得到的句子向量無法準(zhǔn)確表示句子中的語義信息,從而影響文摘質(zhì)量。

發(fā)明內(nèi)容

針對現(xiàn)有的無監(jiān)督文摘技術(shù)語義相關(guān)度低、文摘句冗余度高的問題,本發(fā)明提出了一種基于圖模型的無監(jiān)督自動文摘提取方法,提高了現(xiàn)有無監(jiān)督自動文摘質(zhì)量。

為了實現(xiàn)上述目的,本發(fā)明采用如下技術(shù)方案:

一種基于圖模型的無監(jiān)督自動文摘提取方法,包括如下步驟:

步驟1:對測試數(shù)據(jù)以及語料庫的文本進行預(yù)處理;

步驟2:使用TF-IDF(Term Frequency–Inverse Document Frequency,詞頻-逆文檔頻率指數(shù))模型,訓(xùn)練得到樣本特征詞頻率和逆文檔頻率;

步驟3:將預(yù)處理后的文本和特征詞逆文檔頻率輸入到PV-IDF(Inverse DocumentFrequency of Paragraph Vectors,逆文檔頻率段落向量模型)模型中,訓(xùn)練得到樣本句子向量;

步驟4:利用步驟2得到的樣本特征詞頻率,結(jié)合句子位置和標(biāo)題相似度,計算得到樣本句子綜合權(quán)重;

步驟5:利用步驟3訓(xùn)練得到的樣本句子向量,計算得到樣本句子相似度矩陣ω,利用步驟4得到的樣本句子綜合權(quán)重,計算得到懲罰矩陣ω′ij

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會員可以免費下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于山東科技大學(xué),未經(jīng)山東科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201911321569.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實用新型專利、外觀設(shè)計專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關(guān)于我們 尋求報道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产农村妇女精品一区二区| 亚洲精华国产欧美| 国产一区二区三区午夜| 午夜激情看片| 久久99精品久久久大学生| 久久96国产精品久久99软件| 国产专区一区二区| 一区二区三区四区视频在线| 日韩av在线播放网址| 午夜毛片在线| 少妇精品久久久久www蜜月| 色妞www精品视频| 91精品国产高清一区二区三区| 国产精彩视频一区二区| 538国产精品一区二区在线| 99er热精品视频国产| 在线观看欧美一区二区三区| 久久久久国产精品嫩草影院| 日韩欧美精品一区二区三区经典| 91精品福利在线| 88国产精品视频一区二区三区| 99精品久久久久久久婷婷| 999偷拍精品视频| 91精品一二区| 久久艹亚洲| 精品久久久久久中文字幕| 狠狠躁夜夜av| 国产日韩欧美另类| 91精品一区| 国产一区免费在线| 日韩精品一区二区中文字幕| 久久综合久久自在自线精品自| 国产在线一区观看| 国产精品美女久久久免费| 久久国产欧美日韩精品| 国产一级片子| 狠狠躁夜夜躁| 国内精品在线免费| 亚洲乱码av一区二区三区中文在线: | 国产亚洲综合一区二区| 久久久久国产精品一区二区三区| 狠狠色噜噜狼狼狼色综合久| 国产一区二区三区小说| 狠狠色成色综合网| 亚洲国产精品精品| 国产在线观看免费麻豆| 国产日韩一区在线| 日韩精品乱码久久久久久| 狠狠色综合欧美激情| 国产精品理人伦一区二区三区| 午夜精品在线观看| 亚洲欧美色图在线| 97久久超碰国产精品| 欧美日韩三区二区| 欧美精品一区二区性色| 久久99精品一区二区三区| 亚洲欧洲一区二区| 国产品久精国精产拍| 国产中文字幕91| 国产欧美亚洲精品| 欧美乱妇在线视频播放| 亚洲乱码av一区二区三区中文在线:| 狠狠色噜噜狠狠狠888奇米| 日韩午夜电影院| 91精品www| 日韩一级片免费视频| 久久国产麻豆| 99热一区二区| 国产二区精品视频| 午夜裸体性播放免费观看| 久久99久国产精品黄毛片入口| 欧美亚洲视频二区| 99久久夜色精品国产网站| 亚洲综合日韩精品欧美综合区| 香蕉av一区二区三区| 中文字幕一区二区三区不卡 | 欧美亚洲精品一区二区三区| 日本一级中文字幕久久久久久| 国产精品高潮在线| 性xxxxfreexxxxx交| 在线国产91| 欧美在线视频三区|