日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種基于隱含狄利克雷模型的關鍵詞抽取方法在審

專利信息
申請號: 201410088252.4 申請日: 2014-03-11
公開(公告)號: CN103870447A 公開(公告)日: 2014-06-18
發明(設計)人: 陳里波;胡子揚;祁點點 申請(專利權)人: 北京優捷信達信息科技有限公司
主分類號: G06F17/27 分類號: G06F17/27
代理公司: 蘇州市中南偉業知識產權代理事務所(普通合伙) 32257 代理人: 李廣
地址: 100123 北京市朝陽*** 國省代碼: 北京;11
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 基于 隱含 狄利克雷 模型 關鍵詞 抽取 方法
【說明書】:

技術領域

本發明涉及文字處理領域,更具體的說,涉及一種基于隱含狄利克雷模型的關鍵詞抽取方法 。?

背景技術

統計和分析大量文本信息的一種常用技術就是關鍵詞提取。通常情況下,受制于人力和時間資源,人們無法逐字閱讀海量的文本庫。關鍵詞抽取技術的目標,就是找出文本里最能體現文本主旨的詞匯,方便快速瀏覽,甄選信息。?

為了準確地找到這些詞匯,通常需要對文本進行預處理;基于預處理后的文本,統計詞頻和詞對的共現信息;將詞頻大于或等于預設閾值的詞作為候選關鍵詞;根據詞對的共現信息,計算各候選關鍵詞對文本的重要性;根據計算結果,對候選關鍵詞進行排序,將前N個候選關鍵詞作為文本的關鍵詞,其中,N大于等于1。?

中國專利?CN101872363A于2010年10月27日公開了一種抽取關鍵詞的方法,先在現有技術選取的關鍵詞集的基礎上,疊加所有相鄰的候選關鍵詞,作為候選詞集。然后依照各個候選關鍵詞在文本中的關聯度,抽取關聯程度較高的關鍵詞。這種方法生成的關鍵詞長度較長,故而能涵蓋更全面的信息。位置相鄰的詞通常是用于描述同一事物/觀點的,相鄰的關鍵詞則可能已經橫跨了不同事物/觀點的表述了。常以相鄰位置共現的關鍵詞,可能隱含相對固定的表述次序,無法確知一定是語義上的關聯。?

中國專利CN101196904A于2008年6月11日公開了一種基于詞頻和多元文法的新聞關鍵詞抽取方法通過挖掘文本中潛在關鍵詞的多元文法的詞性模式,將其作為關鍵詞抽取算法的依據。在進行新聞關鍵詞抽取時,首先根據潛在詞性模式挖掘文本中的多元詞組,抽取關鍵詞的候選詞集,然后從標題中挖掘未登錄的潛在關鍵詞,將潛在關鍵詞也加入候選關鍵詞集中。這種方法可以抽取符合詞性模式的多元詞組,通常這樣的詞組表述是連貫的、有意義的。為了保證潛在詞性模式的準確性和完備性,這種方法在應用中,需要首先挖掘一個有相當數量的自然語言語料庫,得到的詞性模式才能被用在真正的關鍵詞提取技術中。這提高了應用的復雜度。另一方面,此專利方案默認,待處理的文本詞性模式與語料庫中的相近。這一點在實際應用中無法得到保證。譬如,語料庫中的文本多是科技論文,那么以科技論文中常出現的詞性模式為依據抽取出的小說散文關鍵詞組,則可能存在偏漏。?

發明內容

本發明所要解決的技術問題是提供一種既不需要額外語料庫,又能夠挖掘出文本中描述的各個“事物”或“觀點”,并依據挖掘出的話題分別抽取關鍵詞的基于隱含狄利克雷模型的關鍵詞抽取方法。?

本發明的目的是通過以下技術方案來實現的:?

一種基于隱含狄利克雷模型的關鍵詞抽取方法 ,包括步驟,

詞匯預處理:先進行詞性標注和分詞,跟進待分析文本構建詞匯表,然后對詞匯表進行修訂。

話題聚類:構建隱含狄利克雷模型,把一篇待分析文本看作若干個隱含話題的分布。每個隱含話題被定義為詞的分布;?

一篇文檔可以包含多個主題,文檔中每一個詞都由其中的一個主題生成。

輸出話題和關鍵詞:預設一個閾值,依據每個詞匯出現在某話題中的條件概率,對詞匯表重新排序,概率大于給定閾值的詞,作為關鍵詞輸出。?

進一步的,所述輸出話題和關鍵詞步驟后,還包括:指定話題和詞匯的強關聯規則,在給定的場景中,優先按照強關聯規則來匹配話題和關鍵詞。?

進一步的,所述詞匯預處理步驟包括:?

把自然語言中的每一句話當作是一個隱馬爾科夫鏈(Hidden?Markov?Chain),使用維特比算法,求出對于觀測到的數據,概率最大的詞性標記序列;運算過程中隱含分詞;

文本中每出現的一個新詞,都會被插入到一張詞匯表里。創建的詞匯表中包含文本中所有詞,且無重復詞;

把自定義詞庫中的詞設置為強相關,加入隱馬爾科夫鏈模型,該模型在標記詞性序列的時候,優先將自定義詞結合為一個詞;

得到了分詞結果和詞性標注序列之后,算法會根據給定的詞性列表對分詞結果進行過濾。

進一步的,所述生成型概率模型為隱含狄利克雷分布(LDA)模型;所述話題聚類步驟包括初始化LDA模型的方法:待分析的文本集?含有篇文檔,。把文檔表示成長度為的詞的序列,。把詞表示成維向量,其中為詞匯表的長度。假定待分析的文檔集共包含個隱含話題,,為根據經驗設定的常數;?

文檔中第個詞所對應的隱含話題服從以為參數的多項式分

布,其中參數向量服從以為參數的狄利克雷分布。初始化使其服從均勻分布。

定義為話題生成詞的概率:,?

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京優捷信達信息科技有限公司,未經北京優捷信達信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201410088252.4/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 日韩精品久久久久久久电影99爱| aaaaa国产欧美一区二区| 欧美一区二区三区四区夜夜大片| 狠狠色噜噜狠狠狠狠米奇777| 国产精品久久久久久久久久嫩草| 国内揄拍国产精品| 中文字幕在线播放一区| 性国产日韩欧美一区二区在线| 激情久久精品| 国产精一区二区三区| 一区精品二区国产| 又黄又爽又刺激久久久久亚洲精品| 国产麻豆91欧美一区二区| 国产精品久久久久久久久久久不卡| 国产精品一二三在线观看| 丰满少妇高潮惨叫久久久一| 亚洲欧洲一区二区| 国产欧美一区二区三区在线| 国产精品视频一区二区二| 91看黄网站| 国产精品无码专区在线观看| 国产免费区| 午夜影院啪啪| 中文字幕一区一区三区| 欧美高清性xxxx| 精品国产乱码久久久久久久久| 国产偷自视频区视频一区二区| 中文字幕一区二区三区四| 91久久国产露脸精品| 欧美一级不卡| 99久久婷婷国产综合精品草原| 国产欧美日韩va另类在线播放| 91香蕉一区二区三区在线观看| 国产精品一区二| 国产欧美日韩va另类在线播放| 爱看av在线入口| 99视频国产在线| 国产1区在线观看| 国产欧美一区二区精品性色超碰| 一区二区中文字幕在线| 国产欧美一区二区三区免费| 手机看片国产一区| 国产美女视频一区二区三区| 日日夜夜亚洲精品| 国产第一区二区| 国产一二区精品| 国产69精品久久久久9999不卡免费| 欧美日韩一区二区三区四区五区六区 | 野花社区不卡一卡二| 国产精品国产三级国产专播精品人| 国产一区在线精品| 久久乐国产精品| 亚洲国产精品激情综合图片| 中文字幕日韩有码| 97人人模人人爽人人喊0| 少妇自拍一区| 国产精品久久久久久久龚玥菲| 欧美一区二区三区免费视频| 国产无套精品一区二区| 午夜天堂在线| 欧美一区二区三区久久久精品| 国产一区免费播放| 国产一区在线视频观看| 国产在线一二区| 91精品国产91热久久久做人人| 99国产精品9| 国产午夜精品一区二区理论影院 | 91久久免费| 国产欧美一区二区精品久久| 日本黄页在线观看| 精品一区二区三区视频?| 国产一区网址| 91精品久久久久久久久久| 男女午夜影院| 一区二区久久精品| 猛男大粗猛爽h男人味| 日本一二三四区视频| 亚洲国产美女精品久久久久∴| 精品久久久久久中文字幕大豆网| 一区二区三区日韩精品| 午夜av在线电影| 91精品久久久久久综合五月天| 96国产精品| 欧美日韩国产色综合视频| 国产精品无码永久免费888| 精品一区中文字幕| 日韩av不卡一区| 久久99精| 妖精视频一区二区三区| 欧美乱大交xxxxx古装| 日韩美一区二区三区| 欧美一区二区三区免费观看视频| 欧美69精品久久久久久不卡| 午夜色影院| 窝窝午夜精品一区二区| 99久久免费精品视频| 国产精品午夜一区二区三区视频| 香蕉视频在线观看一区二区| 综合欧美一区二区三区| 香蕉av一区二区三区| 国产精品一区二区在线观看| 亚洲国产精品一区二区久久,亚洲午夜| 色婷婷久久一区二区三区麻豆 | 欧洲精品一区二区三区久久| 岛国黄色av| xxxx国产一二三区xxxx| 精品久久久久一区二区| 久久精品99国产国产| 国产日韩一二三区| 国产精品欧美久久| 久久精品国产亚洲一区二区| 久久九九国产精品| 国产999久久久| 亚洲乱亚洲乱妇28p| 久久精视频| 精品福利一区二区| 性生交片免费看片| 欧美一区二区三区久久久久久桃花| **毛片在线| 日日夜夜亚洲精品| 91国偷自产一区二区介绍| 国产精品午夜一区二区| 亚洲欧美一卡| 亚洲精品久久久久不卡激情文学| 欧美日韩一级在线观看| 亚洲乱亚洲乱妇50p| 中文字幕一区二区三区四| 久久综合伊人77777麻豆| 亚洲精品国产精品国产| 亚洲精品欧美精品日韩精品| 日韩一区国产| 99er热精品视频国产| 国产一级大片| 国产精品午夜一区二区| 欧美一区二区三区艳史| 午夜生活理论片| 亚洲四区在线| 国产麻豆一区二区三区精品| 久久福利免费视频| 精品久久国产视频| 中文字幕视频一区二区| 99久久精品一区字幕狠狠婷婷| 视频二区狠狠色视频| 理论片高清免费理伦片| 国产69久久| 国产高潮国产高潮久久久91| 国产精品偷乱一区二区三区| 国产精品一区二区中文字幕| 欧美日韩精品影院| 久久综合伊人77777麻豆| 狠狠色噜噜狼狼狼色综合久| 视频一区二区国产| 国产福利一区在线观看| 欧美中文字幕一区二区三区| 日韩精品免费一区二区在线观看| 91精品国产麻豆国产自产在线| 久99久精品| 国产一二区精品| www亚洲精品| 爽妇色啪网| 91精品久久久久久久久久| 正在播放国产一区二区| 午夜电影三级| 性少妇freesexvideos高清bbw| 激情久久一区二区三区 | 456亚洲精品| 日本福利一区二区| 国产91综合一区在线观看| 欧美日韩中文不卡| 午夜a电影| 亚洲区日韩| 国产精品久久久久久一区二区三区| 99视频国产在线| 国产1区在线观看| 欧美日韩国产精品一区二区| 午夜一区二区视频| av午夜影院| 国产偷国产偷亚洲清高| 亚洲久色影视| 国产一区第一页| 国产91视频一区| 99久久国产免费,99久久国产免费大片| 国产理论一区二区三区| 视频二区狠狠色视频| 日韩精品免费一区二区在线观看| 热久久一区二区| 少妇自拍一区| 精品中文久久| 91久久久久久亚洲精品禁果| 欧美日韩亚洲三区| xxxxhd欧美| 国产在线播放一区二区| 一区二区三区精品国产| 久久69视频| 国产午夜精品免费一区二区三区视频| 91精品啪在线观看国产手机| 精品国产品香蕉在线| 国产欧美一区二区三区在线看| 日韩精品一区在线视频| 欧美日韩一区二区三区精品| 国产1区在线观看| 国产精品一区二区在线观看| 欧美3p激情一区二区三区猛视频 | 狠狠色依依成人婷婷九月| 97香蕉久久国产超碰青草软件| 国产精品久久久av久久久| 精品国产一区在线| 丰满岳乱妇在线观看中字| 国产日韩欧美精品| 激情久久一区二区| 午夜精品一二三区| 韩日av一区二区| 浪潮av色| 狠狠搞av| 在线观看v国产乱人精品一区二区| 国产一区二区黄| 亚洲二区在线播放视频| 91精品福利观看| 欧美在线视频一二三区| 免费久久一级欧美特大黄| 91精品国产高清一区二区三区| 国产精品九九九九九| 四虎国产永久在线精品| 午夜影皖精品av在线播放| 国产在线一区二区视频| 亚洲福利视频一区| 片毛片免费看| 精品国产乱码一区二区三区a| 欧美freesex极品少妇| 久久99国产综合精品| 国产白丝一区二区三区| 欧美高清性xxxx| 中文字幕一区一区三区| 久久97国产| 国产午夜精品一区二区三区在线观看| 日韩欧美激情| 欧美一区二区三区久久久精品| 久久99国产综合精品| 国产在线精品一区| 精品福利一区二区| 人人玩人人添人人澡97| 日本中文字幕一区| 91精品啪在线观看国产手机| 国产精品乱码一区| 97视频久久久| 999久久久国产精品|