日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]文檔集摘要獲取方法及裝置無效

專利信息
申請號: 200810239344.2 申請日: 2008-12-10
公開(公告)號: CN101751425A 公開(公告)日: 2010-06-23
發明(設計)人: 萬小軍;楊建武;肖建國 申請(專利權)人: 北京大學;北大方正集團有限公司;北京方正電子政務信息科技有限公司
主分類號: G06F17/30 分類號: G06F17/30
代理公司: 北京同達信恒知識產權代理有限公司 11291 代理人: 黃志華
地址: 100871*** 國省代碼: 北京;11
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 文檔 摘要 獲取 方法 裝置
【說明書】:

技術領域

發明涉及語言文字處理領域以及信息檢索技術領域,尤其涉及一種文檔集摘要獲取方法及裝置。

背景技術

隨著互聯網技術的快速推廣和應用,文檔集摘要的獲取技術已經被廣泛的應用于文本/網站內容的檢索領域。文檔集摘要獲取技術是指:由計算機系統自動從一個包含多篇文檔的文檔集中,獲取反映該文檔集中文檔內容要點的信息。該技術可以為用戶提供文檔集簡明扼要的內容描述,為用戶查閱大量文檔內容提供了便利。例如,某互聯網門戶網站所提供的新聞服務的基本實現原理為首先收集網絡上的各種新聞信息,并按照主題和文檔類型,對收集到的新聞信息進行歸類,形成多個文檔集,使用上述文檔集摘要的獲取技術獲取每個文檔集的摘要,以便于用戶能夠快捷方便的瀏覽感興趣的新聞。

現有的文檔集摘要獲取方法主要分為兩類:基于句子抽取(Extraction)的文檔集摘要獲取方法和基于句子生成(Abstraction)的文檔集摘要獲取方法。其中,基于句子抽取的文檔集摘要獲取方法的實現原理為對文檔集中的每篇文檔,按句進行分割,根據預定的句子權重值衡量指標,例如句子位置、詞語類簇、主題簽名、關鍵詞頻率/倒序索引頻率(TF/IDF)等,確定分割得到的每個句子在文檔集中的重要性權重值,選擇重要性權重值最大的至少一個句子形成所述文檔集的摘要。基于句子生成的文檔集摘要獲取方法的實現原理為根據自然語言理解技術,對文檔集中的每個句子進行語法和語義分析,并使用信息抽取或自然語言生成技術產生新的句子,從而獲得所述文檔集的摘要。從以上的描述可以看出,基于句子抽取的文檔集摘要獲取方法所獲取的文檔集的摘要,是由文檔集中文檔所包含的已有句子組成的,不需要借助復雜的深層自然語言理解技術對文檔集中所包含內容信息進行分析,因此基于句子抽取的文檔集摘要獲取方法與基于句子生成的文檔集摘要獲取方法相比,實現較為簡單。

現有的基于句子抽取的文檔集摘要獲取方法在確定文檔集中每個句子的重要性權重值時,除上述介紹的基于預定的句子權重值衡量指標的方式之外,也可以使用基于圖模型的方法。例如,文章Summarizing?Similarities?andDifferences?Among?Related?Documents(作者是I.Mani?and?E.Bloedorn,發表于2000年出版的期刊Information?Retrieval)公開了一種名為WebSumm的方法,WebSumm方法利用圖連接模型,其中圖連接模型中的頂點分別代表文檔集中的每個句子,假設與其它頂點連接越多的頂點所代表的句子的重要性越高,以此來對確定文檔集中的句子的重要性權重值,從而獲得文檔集的摘要。

在上述介紹的基于圖模型確定文檔集中每個句子的重要性權重值的方法中,只考慮了文檔集中句子之間的關系,沒有考慮句子與文檔的關系對句子的重要性的影響,即假定文檔集中所有文檔的重要性都是相等的,然而通常文檔集中不同文檔的重要性是不同的,現有的基于圖模型的文檔集摘要獲取方法并不能反映文檔集中不同文檔的重要性差異對獲取文檔集摘要結果的影響,因此文檔集摘要的獲取效果不佳。

發明內容

本發明實施例提供一種文檔集摘要獲取方法及裝置,用以解決現有基于圖模型獲取文檔集摘要的方式文檔集摘要獲取效果不佳的問題。

本發明實施例提供的技術方案如下:

一種文檔集摘要獲取方法,包括:

提取文檔集中各個文檔中包含的各個句子,組成句子集合;

基于文檔集中的文檔和句子集合中的句子之間的文本相似度,確定句子集合中各個句子的重要性權重值;

根據確定的重要性權重值,按照重要性權重值由高至低的選擇順序,選擇規定數目的句子組成文檔集摘要。

一種文檔集摘要獲取裝置,包括:

句子集合提取單元,用于提取文檔集中各個文檔中包含的各個句子,組成句子集合;

句子重要性權重值確定單元,用于基于文檔集中的文檔和句子集合中的句子之間的文本相似度,確定句子集合中各個句子的重要性權重值;

摘要確定單元,用于根據句子重要性權重值確定單元確定的重要性權重值,按照重要性權重值由高至低的選擇順序,選擇規定數目的句子組成文檔集摘要。

本發明實施例提出的多文檔摘要獲取方法,利用了文檔集中句子和文檔之間的關系,考慮了文檔集中不同文檔重要性的差異對句子重要性權重值的影響,因此能夠更準確的確定文檔集中句子的重要性權重值,并選擇重要性權重值高的句子組成文檔集摘要,因此能夠獲得更佳的文檔集摘要獲取效果。

附圖說明

圖1為本發明實施例的主要實現原理流程圖;

圖2為本發明實施例中文檔集二部圖的示意圖;

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京大學;北大方正集團有限公司;北京方正電子政務信息科技有限公司,未經北京大學;北大方正集團有限公司;北京方正電子政務信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/200810239344.2/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 一区二区在线不卡| 欧美在线视频一二三区| 国产精品久久久久久久久久不蜜臀| 国产69精品久久99不卡免费版| 国产电影一区二区三区下载| 97久久国产亚洲精品超碰热| 国产精品亚洲第一区| 国产一区二区播放| 国产精品久久久久久久久久不蜜臀| 欧美亚洲视频二区| 午夜伦理片在线观看| 激情久久一区二区| 日本一区二区三区免费视频| 日韩av在线电影网| 欧美日韩一区二区三区不卡| 欧洲在线一区| 欧美一区二区三区日本| 色乱码一区二区三区网站| 国产jizz18女人高潮| aaaaa国产欧美一区二区| 免费毛片**| 久久国产精品99国产精| 国产91一区| 国产一区二区视频播放| 日本一区二区三区在线看| 国产九九九精品视频| 久久免费视频一区| 久久夜色精品国产噜噜麻豆| 国产精品视频久久久久| 久久九精品| 国产69精品久久久久app下载 | 老女人伦理hd| 欧美一区二区久久| 国产精品一二三在线观看| 一区二区免费播放| 国产一级在线免费观看| 国产精品一区二区不卡| 中文乱码字幕永久永久电影| 国产精品欧美一区乱破| 国产97免费视频| 性色av色香蕉一区二区| 在线国产91| 国产高清精品一区二区| 日韩一区二区三区福利视频| 国精偷拍一区二区三区| 国产88av| 综合久久色| 国产九九影院| 国产一区2| 97人人模人人爽人人喊38tv| 国产精品乱综合在线| 狠狠色噜噜狠狠狠狠米奇777| 免费看片一区二区三区| 亚洲国产精品二区| 久久国产中文字幕| 午夜伦全在线观看| 国产在线精品一区二区| aaaaa国产欧美一区二区| 亚洲午夜国产一区99re久久| 欧美日韩一级二级三级| 国偷自产一区二区三区在线观看| 蜜臀久久99精品久久一区二区| 国产91在线拍偷自揄拍| 国产二区精品视频| 狠狠色噜噜狠狠狠四色米奇| 国产欧美一区二区精品久久久| 欧美黑人巨大久久久精品一区| 国产精品亚洲二区| 国产亚洲欧美日韩电影网| 亚洲国产偷| 日韩欧美中文字幕精品| 国产88av| 2023国产精品自产拍在线观看| 岛国黄色av| 国产一区二区91| 中文字幕视频一区二区| 亚洲乱视频| 日韩欧美中文字幕一区| 欧美黄色片一区二区| 精品久久久久久亚洲综合网| 国产精品一区二区在线观看 | 久久99精品久久久久婷婷暖91| 精品久久二区| 日本午夜精品一区二区三区| 久久久人成影片免费观看| 夜夜嗨av一区二区三区中文字幕| 99热久久这里只精品国产www| 久久午夜鲁丝片| 亚洲国产日韩综合久久精品| 欧美在线精品一区| 久久密av| 国产精品一区二区久久乐夜夜嗨| 一区二区三区欧美日韩| 午夜一区二区三区在线观看| 国产精品1234区| 欧美国产亚洲精品| 国产精品高潮呻吟视频| 国产欧美日韩va另类在线播放| 欧美综合在线一区| 日韩久久精品一区二区| 欧美国产一区二区三区激情无套| 国产免费区| 久久综合伊人77777麻豆最新章节 一区二区久久精品66国产精品 | 久久久精品99久久精品36亚| 欧美大片一区二区三区| 久久网站精品| 久久久一二区| 欧美精品久久一区| 国产一区二区三区在线电影| 亚洲精品性| 中文字幕一区二区三区乱码| 国产无遮挡又黄又爽又色视频| 2020国产精品自拍| 日韩美一区二区三区| 国产人成看黄久久久久久久久| 中文字幕区一区二| 国产精品亚洲精品| 精品国产一区二区三区免费| 国产三级欧美三级日产三级99| 国产69精品久久久久app下载| 国产伦精品一区二区三区免费优势| 国产精品一二二区| 国产高清一区在线观看| 91超薄丝袜肉丝一区二区| 国产经典一区二区三区| 国产精品1区二区| 亚洲va久久久噜噜噜久久0| 国产午夜精品一区二区三区视频| 国产人成看黄久久久久久久久| 国产精品一区一区三区| 亚洲国产精品女主播| 亚洲欧美另类久久久精品2019| 国产精品国外精品| 欧美大成色www永久网站婷| 久久99精品国产麻豆婷婷洗澡| 久久精品视频中文字幕| 91狠狠操| 999久久国精品免费观看网站| 亚洲国产精品一区在线观看| 亚洲福利视频二区| 午夜电影一区二区三区| 日韩精品一区在线观看| 国产精品不卡一区二区三区| 国产综合亚洲精品| 91久久国语露脸精品国产高跟| 中文字幕一区三区| 国产欧美www| 99国产精品| 久久国产精品网站| 亚洲欧美国产日韩综合| 猛男大粗猛爽h男人味| 96国产精品| 日韩欧美视频一区二区| 国产免费一区二区三区网站免费| 中文在线一区| 日本白嫩的18sex少妇hd| 国产精品免费不卡| 久久99精品久久久久国产越南 | 97精品国产97久久久久久| 国产精品区一区二区三| 91理论片午午伦夜理片久久 | 国产性生交xxxxx免费| 亚洲欧美一二三| 国产精品日韩视频| 欧美精品第一区| 91性高湖久久久久久久久_久久99| 日韩毛片一区| 国产一区三区四区| 国精偷拍一区二区三区| 在线观看欧美日韩国产| 国产精品亚发布| 99热一区二区| 国产精品九九九九九| 国产乱人伦精品一区二区三区| 国产欧美一区二区三区沐欲| 欧美日韩综合一区| 国产天堂第一区| 国产乱对白刺激视频在线观看| 亚洲乱码一区二区| 欧美hdfree性xxxx| 肥大bbwbbwbbw高潮| 日本精品三区| 视频一区二区三区中文字幕| 国产伦精品一区二区三区照片91| 日韩精品久久久久久久电影99爱| 91免费视频国产| 亚洲精品卡一卡二| 97国产精品久久| 久久午夜鲁丝片| 日韩亚洲精品视频| 国产69精品久久久久按摩| 欧美性二区| 色一情一乱一乱一区免费网站| 国产88久久久国产精品免费二区| 亚洲日韩欧美综合| 国内少妇偷人精品视频免费| www.久久精品视频| 欧美极品少妇xx高潮| 伊人久久婷婷色综合98网| 亚洲午夜精品一区二区三区电影院| 国产精品麻豆一区二区| 欧美日韩中文字幕一区| 天堂av色婷婷一区二区三区| 欧美一区二区久久| 日韩三区三区一区区欧69国产| 日本aⅴ精品一区二区三区日| 国内精品久久久久久久星辰影视| 高清欧美精品xxxxx| 精品香蕉一区二区三区| 精品videossexfreeohdbbw| 欧美精品xxxxx| 国产在线视频二区| 日韩三区三区一区区欧69国产| 欧美久久久一区二区三区| 欧美一级久久精品| 日韩久久影院| 久久精品手机视频| 狠狠色狠狠色综合久久第一次| 精品少妇一区二区三区 | 国产乱一乱二乱三| 精品久久久综合| 午夜电影院理论片做爰| 国产激情二区| 国产无遮挡又黄又爽又色视频| 国产aⅴ精品久久久久久| 欧美一区二三区| 理论片午午伦夜理片在线播放| 少妇av一区二区三区| 国产一区二区三区午夜| 国产亚洲精品久久久456| 狠狠色噜噜狠狠狠狠视频| 亚洲欧美v国产一区二区| 欧美精品在线视频观看| 991本久久精品久久久久| 国产美女三级无套内谢| 强制中出し~大桥未久10在线播放| 国产资源一区二区三区| 亚洲精品国产一区二| 久久99精品国产一区二区三区| 亚洲一区2区三区| 日韩精品中文字幕一区| 综合欧美一区二区三区| 韩国女主播一区二区| 日韩欧美国产另类| 狠狠色狠狠色综合系列| 在线视频国产一区二区|