日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種關鍵詞抽取方法有效

專利信息
申請號: 201310316483.1 申請日: 2013-07-25
公開(公告)號: CN103399901A 公開(公告)日: 2013-11-20
發明(設計)人: 周進華;熊張亮;胡永;張濤 申請(專利權)人: 三星電子(中國)研發中心;三星電子株式會社
主分類號: G06F17/30 分類號: G06F17/30
代理公司: 北京德琦知識產權代理有限公司 11018 代理人: 蔣歡;王琦
地址: 210061 江蘇省*** 國省代碼: 江蘇;32
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 關鍵詞 抽取 方法
【說明書】:

技術領域

本申請涉及文本處理中的關鍵詞抽取技術領域,特別涉及一種關鍵詞抽取方法。

背景技術

隨著計算機和網絡技術的發展,數字化的文件正以驚人的速度在瘋狂增長。人們每天要花費大量的時間和精力去閱讀和查找文件。為了節省時間和提高人們工作的效率,于是原始文檔的各種簡潔表示,比如摘要和關鍵詞等形式應運而生。

關鍵詞被定義成壓縮表示了原始文本重要信息和核心內容的詞。人們可以通過它快速了解文本的大致內容,而不需要通讀全文。在信息檢索中,關鍵詞常被我們用來查找內容相關的文檔。此外,關鍵詞在話題探測和跟蹤、文本分類和聚類等任務中都有重要的應用。目前,除了形式規范的科技論文提供了關鍵詞外,大部分文檔都沒有作者或讀者分配的關鍵詞。傳統的依靠人工去閱讀文本,然后抽取關鍵詞的方法在文檔數量劇增的今天越來越不能滿足實際應用的需要。因此,如何自動抽取關鍵詞成了時下文本處理領域的一個研究熱點。

從人工選擇關鍵詞的過程可以知道,關鍵詞可以是預定義的類別,也可以是從文本中抽取的反映核心內容和重要信息的詞。第一種方法可以看成是一個文本分類的問題,它將現成的文本分配到預定義的一個或幾個類別中,從而可以采用文本分類的思路和技術進行關鍵詞的抽取。第二種方法就是本申請所涉及的方法,它從原始文本中抽取反映文檔主要內容的詞,而不需要預先建立一個相關領域的類別體系。

目前關鍵詞自動抽取的技術可以分為簡單統計的方法、語言分析的方法和機器學習的方法。

語言分析的方法采用自然語言處理中詞法、句法及語義分析等技術,在對文檔進行深入理解的基礎上抽取文檔中反映其主要內容的詞。雖然該類方法有很大的潛力提高抽取的關鍵詞的質量,但是目前自然語言處理技術還在發展過程中,暫時還沒有成熟到可以有效應用到關鍵詞抽取的各種場合。

基于機器學習的方法需要提供大規模特定的樣例進行學習。不同領域的應用需要采用相應領域的樣例,而且訓練模型需要花費大量的時間。該類方法對authoring(文本創作)及網頁等不確定領域環境中關鍵詞抽取的應用,效果較差。

簡單統計的方法不依賴于特定語言和特定領域,僅通過對文本中各種語言單元進行統計分析以自動產生關鍵詞。這種方法簡單、快速,幾乎可以應用于所有需要關鍵詞的任務中。

在簡單統計的方法中,詞頻和詞語共現關系等常被用于關鍵詞的抽取。統計方法tf*idf中的tf就表示詞頻,它常用于評估一個詞對一個文檔集或語料庫中某個文檔的重要性。下面簡要介紹現有技術中幾種典型的簡單統計方法。

Yukio?Ohsawa等人在1998年提出的KeyGraph方法利用文檔中詞間的共現關系構造一個圖,圖中的每個節點表示一個詞項。KeyGraph方法將共現圖切割成多個涵蓋了作者觀點的互相連通的最大子圖(簇),然后統計詞項和這些簇的關系,并將排名靠前的若干個詞返回做關鍵詞。

TextRank是Rada?Mihalcea和Paul?Tarau在2004年提出的又一個基于圖的關鍵詞抽取算法。該算法利用長度為n的窗口中詞項的共現關系構建詞共現圖,然后通過節點的出度、入度及邊的權重計算詞項的重要性,并選取最重要的若干個詞作為文檔的關鍵詞。

2004年,Yutaka?Matsuo等人采用χ2計算單文本中詞項的共現分布對高頻詞集的偏置程度決定詞的重要性。該方法還通過對共現矩陣中高頻列的聚類來改善算法的準確性。

Stuart?Rose等人在2010年提出的RAKE算法利用詞度對詞頻的比例從文本摘要中抽取關鍵詞。其中,詞度為詞頻和該詞的所有共現次數之和。

雖然目前有很多優秀的方法可用于關鍵詞的抽取,特別是基于機器學習的方法和基于語言分析的方法,但是這些方法要么需要帶標注的大規模語料用于學習,要么需要復雜的自然語言處理技術對文本進行深入分析,這些要求對許多應用都不可行或很難滿足。具體來說,現有技術有如下需要改善的地方:

1.現有基于機器學習和基于語言分析的方法都需要特定語言或領域的知識,對于多語言或多領域的應用,需要針對每種語言或領域單獨訓練模型或制定語言規則,然而對任何團隊來說,在短時間內獲取各種語言的語料和領域知識都是一件十分困難的事情。

2.目前簡單統計的方法大多是針對摘要等語言表達緊湊的短文進行關鍵詞抽取,這些算法對篇幅較長的文本的處理效果較差。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于三星電子(中國)研發中心;三星電子株式會社,未經三星電子(中國)研發中心;三星電子株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201310316483.1/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 91精品综合| 四虎国产精品久久| 久久99亚洲精品久久99| 91免费视频国产| 免费xxxx18美国| 久久人人精品| 欧美高清极品videossex| 91精品国产九九九久久久亚洲 | 秋霞av电影网| 国产精品一区二区av麻豆| 久久国产精品首页| 国产一区二区三区网站| 久久国产精品久久| 躁躁躁日日躁网站| 特高潮videossexhd| av午夜电影| 99精品国产免费久久| 国产精品久久久久久久龚玥菲 | 亚洲欧洲日韩av| 91久久香蕉国产日韩欧美9色| 国产主播啪啪| 国产欧美日韩中文字幕| 国产精品久久久久久久久久久久久久不卡| 欧美大片一区二区三区| 精品999久久久| 国产一区二区精品免费| 国产一级自拍片| 久久国产欧美一区二区免费| 国产精品999久久久| 国产精品亚洲а∨天堂123bt| 欧美精品二区三区| 日韩欧美一区精品| 99国产精品久久久久99打野战 | www.久久精品视频| 午夜精品影视| 国产精品一区在线观看你懂的 | 国模吧一区二区| 波多野结衣女教师30分钟| 国产一区二区三区午夜| 538国产精品| 日本福利一区二区| 色乱码一区二区三区网站| 蜜臀久久99精品久久久| 久久99精品国产麻豆婷婷洗澡| 欧美freesex极品少妇| 亚洲国产99| 欧美日韩三区| 日韩欧美一区二区在线视频| 91亚洲欧美日韩精品久久奇米色| 国内精品久久久久久久星辰影视| 久久精品国产亚洲7777| 国产精品视频1区2区3区| 久久国产精品首页| 夜夜夜夜曰天天天天拍国产| 欧美日韩国产在线一区| 蜜臀久久精品久久久用户群体| 国产精品国产三级国产专区55| 午夜免费av电影| 国产91色综合| 亚洲乱亚洲乱妇50p| 久久精品爱爱视频| 欧美精品日韩精品| 夜夜躁日日躁狠狠躁| 国产日韩欧美网站| 性欧美一区二区三区| 色婷婷综合久久久久中文| 国产精品日韩一区二区三区| 亚洲午夜精品一区二区三区| 国语精品一区| 国产一区二区国产| 久久影视一区二区| 少妇自拍一区| 一区二区久久久久| 欧美精品一级二级| 国产精品视频久久久久| 国产精品白浆一区二区| 一区二区中文字幕在线| 国产aⅴ一区二区| 日韩精品中文字| 欧洲激情一区二区| 国产精品免费专区| 国产性猛交xx乱| xxxx在线视频| 日韩av在线一区| 欧美日韩一级二级| 色噜噜狠狠狠狠色综合久 | 日日噜噜夜夜狠狠| 在线国产91| 国产日韩欧美在线一区| 日韩一级免费视频| 91性高湖久久久久久久久_久久99| 久久一区二区三区视频| 国产一区二区三区国产| 91精品系列| 中文字幕亚洲欧美日韩在线不卡| 亚洲欧美一二三| 中文字幕一区二区三区不卡| 26uuu色噜噜精品一区二区| 午夜剧场a级片| 久久久精品观看| 国产第一区在线观看| 99国产超薄丝袜足j在线观看| 亚洲自拍偷拍中文字幕| 另类视频一区二区| 国产免费第一区| 欧美精品免费看| 国产一区二区黄| 久久精视频| 日韩精品久久久久久久的张开腿让 | av午夜电影| 精品国产一区二区三区久久久久久| 视频一区二区三区中文字幕| 国产乱人伦偷精品视频免下载| 激情欧美一区二区三区| 国产伦精品一区二| 少妇**毛片| 国产一区二区日韩| 99日本精品| 一区二区在线精品| 日本道欧美一区二区aaaa| 91精品第一页| 中文字幕一区一区三区| 高清欧美精品xxxxx在线看| 日韩av在线网| 欧美高清视频一区二区三区| 一区二区三区电影在线观看| 亚洲国产精品日韩av不卡在线| 午夜精品999| 国产精品欧美一区乱破| 国产日韩精品一区二区| 欧美精品日韩精品| 国产日韩欧美视频| 国产欧美日韩中文字幕| 素人av在线| 色吊丝av中文字幕| 日本丰满岳妇伦3在线观看| 国产日韩一区二区在线| 国产在线观看免费麻豆| 猛男大粗猛爽h男人味| 久久国产激情视频| 欧美国产在线看| 国产一级片一区| 午夜影院毛片| 国产免费区| 91超碰caoporm国产香蕉| 亚洲精品主播| 国产精品免费一区二区区| 亚洲四区在线| 欧美精品一区二区三区在线四季| 亚洲精品人| 欧美一区二区三区高清视频| 欧美色综合天天久久| 天干天干天啪啪夜爽爽99| 国产一级片网站| 国产一区二区日韩| 久久er精品视频| 天摸夜夜添久久精品亚洲人成 | 欧美日本一二三区| 视频一区二区中文字幕| 天堂av色婷婷一区二区三区| 亚洲国产精品区| 乱子伦农村| 北条麻妃久久99精品| 99精品久久久久久久婷婷| 蜜臀久久99静品久久久久久| 欧美综合国产精品久久丁香| 国产乱码精品一区二区三区中文| 狠狠插狠狠插| 亚洲精品一区二区三区香蕉| 亚洲欧美一区二区三区三高潮| 久久精品亚洲精品国产欧美| 欧美日韩中文国产一区发布| 国产视频一区二区在线| 久久狠狠高潮亚洲精品| 亚洲精品国产精品国自| 国产伦精品一区二区三| 999久久久国产| 国产极品一区二区三区| 久久99精品国产麻豆婷婷| 国产一区免费在线| 欧美一区二粉嫩精品国产一线天| 欧美乱妇高清无乱码一级特黄| 国产精品久久久久久久新郎| 电影91久久久| 久久99精品久久久久国产越南| 欧美精品二区三区| 国产精品一区二区在线观看| 中文字幕一区2区3区| 国产又黄又硬又湿又黄| 综合欧美一区二区三区| 日韩中文字幕在线一区| 午夜老司机电影| 久久青草欧美一区二区三区| 久久久久久久久久国产精品| 93久久精品日日躁夜夜躁欧美| 国产在线一二区| 美国三级日本三级久久99| 国产精品天堂| 国产999在线观看| 亚洲精品乱码久久久久久按摩| 猛男大粗猛爽h男人味| 国产无遮挡又黄又爽又色视频| 欧美高清xxxxx| 最新av中文字幕| 欧美一级片一区| 久久人人97超碰婷婷开心情五月| 97人人澡人人爽人人模亚洲 | 蜜臀久久精品久久久用户群体| 精品99免费视频| 狠狠色狠狠色88综合日日91 | 香港三日本8a三级少妇三级99| 国产九九影院| 欧美一区二区三区久久精品| 久久aⅴ国产欧美74aaa| 免费视频拗女稀缺一区二区| 国产精品视频久久久久久久| 国产一区日韩在线| 色噜噜狠狠狠狠色综合久| 国产乱了高清露脸对白| 国产一区二区二| 国产第一区二区三区| 日韩精品999| 色噜噜狠狠色综合中文字幕| 国产中文字幕91| 精品久久不卡| 国产午夜一区二区三区| 国产原创一区二区| 国产精品免费一视频区二区三区| 国产日韩精品久久| 精品国产91久久久| 欧美日韩一级二级三级| 国产精品久久久久久久四虎电影| 国产精品视频一区二区三| 欧美在线视频精品| 欧美高清性xxxxhd| 午夜毛片影院| 国产精品免费一视频区二区三区| 国产一区二区激情| 国产视频二区在线观看| 97久久精品人人做人人爽50路| 亚洲精品乱码久久久久久写真| 精品国产一区在线| 久久天堂国产香蕉三区| 久久久久国产亚洲日本| 亚洲欧美国产日韩色伦| 欧美精品免费看|