日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種多特征融合的關鍵詞提取方法在審

專利信息
申請號: 201910328467.1 申請日: 2019-04-23
公開(公告)號: CN110188344A 公開(公告)日: 2019-08-30
發明(設計)人: 高楠;李利娟;李偉;祝建明 申請(專利權)人: 浙江工業大學
主分類號: G06F17/27 分類號: G06F17/27;G06K9/62
代理公司: 杭州斯可睿專利事務所有限公司 33241 代理人: 王利強
地址: 310014 浙江省*** 國省代碼: 浙江;33
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 候選關鍵詞 關鍵詞組 多特征融合 關鍵詞提取 文本 詞性 決策樹分類模型 詞頻 關鍵詞短語 關鍵詞序列 詞頻信息 分類算法 機器學習 結果評估 模型預測 權重信息 屬性信息 特征屬性 信息計算 區分度 新文本 準確率 權重 詞語 跨度 篩選 分類 概率 統計
【說明書】:

一種多特征融合的關鍵詞提取方法,首先根據文本詞性和詞頻信息篩選候選關鍵詞,統計候選關鍵詞的多種特征屬性,訓練基于決策樹分類模型,將新文本中的候選關鍵詞的屬性信息輸入模型預測出文本的關鍵詞序列,然后進行n?gram連接得到關鍵詞組,最后取權重最高的topK個關鍵詞或關鍵詞組進行結果評估。本發明可以全面的考慮關鍵詞在文本中的詞頻、位置、跨度、詞性、詞語的區分度等信息,并結合機器學習分類算法得到分類的概率值,最后結合關鍵詞的權重信息和n?gram信息計算關鍵詞組的最終得分。可以有效的提取關鍵詞和關鍵詞短語,相較于現有的方法在準確率上有一定的提升。

技術領域

本發明涉及一種基于多特征融合的關鍵詞提取方法,特別是針對學術摘要文本的關鍵詞提取。利用中文文本分詞工具對文本進行分詞,然后再統計文本詞語的多種屬性特征,將關鍵詞提取看作一個二分類問題利用機器學習分類模型訓練關鍵詞分類器,涉及概率模型,語言模型,機器學習等領域,具體涉及基于機器學習建模領域。

背景技術

隨著學術研究成果的不斷積累,論文庫越來越大,如何在海量的學術文章中準確的找到領域相關的文章是一個重要的技術要求。關鍵詞提取能夠對文本的主要信息進行提煉,能夠很好的提取出反映文章主要內容的關鍵短語,更好的提高了信息查詢的準確度和信息訪問的效率。

從提取方法來說大致有兩種:關鍵詞分配,即給定一個關鍵詞庫然后從詞庫中找到幾個短語作為某篇文章的關鍵詞。另一種方法是關鍵詞提取,即就是從一篇文章中提取一些詞語作為這篇文章的關鍵詞。目前大多數關鍵詞研究都是基于關鍵詞提取的,關鍵詞提取相比于關鍵詞分配更具有實際意義。基于是否需要標記語料庫,自動關鍵詞提取方法可以大致分為有監督方法和無監督方法。有監督機器學習是從給定的訓練集中訓練出一個模型,對新數據,利用這個模型來預測結果。在關鍵詞抽取領域中,可以把關鍵詞抽取任務轉化為分類問題或標注問題即:把文檔中的詞看成是候選的關鍵詞,通過分類學習算法或序列標注方法來判斷這些候選詞是否為關鍵詞。基于有監督學習的關鍵詞抽取的一般步驟是:首先,建立一個包含大量文本并標出關鍵詞的訓練集合;然后,利用訓練集合對分類或標注算法進行訓練得到一個模型;最后,應用訓練好的模型對新文本進行關鍵詞抽取。從研究方法上有監督學習方法又可以被分為兩類:一是把關鍵詞抽取看成二分類問題,即判斷文檔中的一個詞是關鍵詞或不是關鍵詞。有監督學習的方法,研究點主要放在詞語特征表示、分類模型表示和標注語料方面。無監督關鍵詞提取方法包括語言分析法、統計方法、主題方法和基于網絡圖的方法。這些方法用于從未標記的語料庫中提取關鍵詞。比較經典的TFIDF方法考慮了詞的頻率和逆文檔頻率,TF-IWF等方法在此基礎上做了改進。TextRank考慮了詞的共現信息,Rake方法考慮了詞的共現矩陣中詞的度的信息和詞頻信息。現在也有很多研究者在此基礎上作者各種改進,盡管如此現有的關鍵詞提取方法不足之處還是很明顯:1、候選詞的屬性考慮不全面,有的考慮了詞的頻率忽略了詞性、位置信息,有的考慮了詞的共現信息忽略了文本結構信息等,影響了關鍵詞提取的準確率。2、候選詞的評分機制過于主觀化,以人的先驗知識作為評分規則的解釋標準或是根本就沒有說明評分規則設定的依據。

在學術論文分析領域,關鍵詞對于任何學術論文都是非常重要的,關鍵詞是反映學術論文主旨的單個詞或詞語的組合,是一篇文章中的一組重要詞匯,它向讀者提供了對其內容的高級描述,是對文本最簡潔的描述,也可以基本上反映文本主題,在信息檢索、文本分類和聚類、數據挖掘等領域有重要意義。學術關鍵詞存在于文本標題和摘要甚至全文中的語句都是蘊藏大量原始知識內容的集合體中,但是學術文章中關鍵詞提取面臨著很多的難點:一方面,學術論文章節多、信息量大,關鍵詞全文提取獲得的候選詞數量巨大,加重了選擇的難度,降低了準確度。另一方面,受知識產權保護,大量學術論文僅提供前16頁或大綱、摘要部分供讀者閱覽,難以從全文中提取關鍵詞。盡管有許多標記界面可以手動標記文獻,但這種行為既可以是主觀的,也是勞動密集型的,所以關鍵詞提取在學術文章領域有很好的應用前景。

因此,如何有效的提取學術文本中的關鍵詞,快速、準確的實現學術摘要中關鍵信息的提取,成為需要技術人員解決的問題。

發明內容

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江工業大學,未經浙江工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201910328467.1/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 色婷婷综合久久久久中文| 欧美激情片一区二区| 日韩精品久久久久久久的张开腿让| 欧美精品乱码视频一二专区| 欧美一区二区精品久久| 国产精品久久久久久久久久久久久久久久久久 | 午夜精品一二三区| 日韩av一区二区在线播放| 狠狠色综合欧美激情| 亚洲国产午夜片| 中文乱码在线视频| 欧美精品在线一区二区| 精品国产乱码久久久久久图片| 久久九九亚洲| 97人人澡人人添人人爽超碰| 国产精品久久久久久久久久不蜜月| 男女视频一区二区三区| 久久二区视频| 国产精品久久久久久久久久久久久久不卡| 亚洲一区二区福利视频| 4399午夜理伦免费播放大全| 欧美日韩精品在线播放| 午夜大片网| 欧美日韩精品在线一区二区| 国产一区亚洲一区| 亚洲欧洲日韩在线| 欧美激情综合在线| 国产欧美一区二区精品久久久| 亚洲精品乱码久久久久久麻豆不卡| 97精品久久人人爽人人爽| 亚洲日韩欧美综合| 精品一区在线观看视频 | 欧美日本三级少妇三级久久| 亚洲午夜精品一区二区三区电影院| 国产女性无套免费看网站| 国产精品高潮呻吟三区四区| 在线亚洲精品| 欧美在线一级va免费观看| 国产日韩欧美网站| 一区二区精品久久| 狠狠躁夜夜躁2020| 日韩精品免费播放| 性生交片免费看片| 国产69精品久久99不卡解锁版| 国产精彩视频一区二区| 久久影院国产精品| 国产一区二区三区精品在线| 国产一区二区视频在线| 色婷婷精品久久二区二区蜜臂av| 91热国产| 色狠狠色狠狠综合| 日韩av在线网址| 国产一区二区在线91| 国产精品18久久久久白浆| 国产理论片午午午伦夜理片2021 | 四虎国产精品永久在线| 国产精一区二区三区| 欧美日韩一区二区三区不卡| 91精品国产91热久久久做人人| 国产一区二区电影在线观看| 最新国产一区二区| 日韩一区二区精品| 夜色av网| 精品无码久久久久国产| 日韩精品一区二区免费| 国产精品日韩精品欧美精品| av午夜在线| 国产精品久久国产三级国电话系列 | 久久精品国产综合| 午夜影皖精品av在线播放| 国产一区二区免费电影| 欧美乱妇高清无乱码| 久久第一区| 欧美一区二区三区不卡视频 | av国产精品毛片一区二区小说| 欧美日本三级少妇三级久久| 国产一区二区黄| 国产一区二区麻豆| 亚洲va国产2019| 国产精品亚洲精品一区二区三区| 欧美日韩一区二区三区免费| 亚洲精品久久久久玩吗| 国产精品一区久久人人爽| 日本一区二区三区中文字幕| 午夜影院啪啪| 精品国产一区二区三| 国产一区二区三区小说| 久久久久久国产精品免费| 欧美中文字幕一区二区| 久久精品二| 狠狠色狠狠综合久久| 国产另类一区| 欧美系列一区| 91精品第一页| 国产精品高潮呻吟88av| 99久久婷婷国产精品综合| 免费a级毛片18以上观看精品| 国产一区二区在线免费| 欧美久久一区二区三区| 91久久国产露脸精品国产| 国产精品二区一区| 欧洲另类类一二三四区| 国产精品美女久久久免费| 日本xxxxxxxxx68护士| 欧美激情在线一区二区三区| 午夜电影理伦片2023在线观看| 精品国产乱码久久久久久软件影片| 欧美乱妇高清无乱码| 午夜精品一区二区三区三上悠亚 | 国产日产欧美一区| 日韩一级精品视频在线观看 | 午夜666| 国产婷婷一区二区三区久久| 神马久久av| 欧美日韩国产精品一区二区亚洲| 国产精品久久久区三区天天噜| 男女午夜影院| 午夜生活理论片| 国产大学生呻吟对白精彩在线| 国产一二三区免费| www色视频岛国| 97国产精品久久| 久久不卡一区| 91福利视频免费观看| 九九精品久久| 国产视频一区二区三区四区| 国产精品一区一区三区| 中文字幕一区二区三区免费| 久久精品国产96| 国产伦高清一区二区三区| 国产一区二区二| 亚洲国产精品美女| 午夜伦全在线观看| 亚洲va欧美va国产综合先锋| 欧美日韩偷拍一区| 亚洲精品国产久| 久久亚洲综合国产精品99麻豆的功能介绍| 窝窝午夜精品一区二区| 欧美精选一区二区三区| 国产va亚洲va在线va| 国产欧美一区二区在线| 狠狠色噜噜狠狠狠狠| 国产精品国产亚洲精品看不卡15 | 性欧美1819sex性高播放| 久久久一二区| 91精品啪在线观看国产线免费| 免费看性生活片| 久久久久久久国产| 国产无遮挡又黄又爽又色视频| 国产精品96久久久久久久| 国产色午夜婷婷一区二区三区| 精品国产一区二区三| 国产日韩欧美一区二区在线观看| 国产午夜伦理片| 久免费看少妇高潮a级特黄按摩| 亚洲精品乱码久久久久久国产主播| 国产女人和拘做受视频免费| 97久久超碰国产精品| 国产91刺激对白在线播放| 日韩美一区二区三区| 久久久久久久国产精品视频| 亚洲国产精品二区| 国产一二区在线| 日韩av不卡一区二区| 色婷婷久久一区二区三区麻豆| 亚洲色欲色欲www| 精品国产亚洲一区二区三区| 日韩av三区| 中文字幕日韩有码| 亚洲精品久久久久中文字幕欢迎你 | 国产精品96久久久| 另类视频一区二区| 欧美精品八区| 日本精品视频一区二区三区| 欧美久久精品一级c片| 狠狠色噜噜狠狠狠狠| 销魂美女一区二区| 国产二区视频在线播放| 性old老妇做受| 色综合久久久久久久粉嫩| 亚洲一区二区福利视频| 亚洲欧美日韩精品在线观看| 精品日韩久久久| 少妇自拍一区| 国产免费一区二区三区四区五区 | 亚洲少妇一区二区| 国产精品久久久久久久久久久久久久久久久久 | 日本少妇高潮xxxxⅹ| 日本神影院一区二区三区| 日韩精品中文字幕一区二区三区 | 99久久精品免费看国产免费粉嫩| 欧美片一区二区| xxxx在线视频| 亚洲精品久久久久不卡激情文学| 亚洲欧洲日韩| 日韩午夜毛片| 丰满岳乱妇在线观看中字| 欧美日韩一区二区高清| 欧美高清视频一区二区三区| 中文字幕av一区二区三区高| 久久人人爽爽| 国产精品1区2区| 国产91丝袜在线| 精品99免费视频| 国产综合亚洲精品| 久久国产精久久精产国| 欧美一区视频观看| 国产乱xxxxx97国语对白| 国产99小视频| 久久精品国产一区二区三区不卡| 国产免费一区二区三区网站免费 | 欧美精品一级二级| 久久96国产精品久久99软件| 免费看农村bbwbbw高潮| 精品国产乱码久久久久久影片| 午夜黄色一级电影| 亚洲第一天堂久久| 国产精品18久久久久白浆| 日韩久久影院| 丝袜脚交一区二区| 日韩精品免费看| 国产精品免费不卡| 97久久国产亚洲精品超碰热| 精品国产乱码久久久久久图片 | 国产精品免费观看国产网曝瓜| 综合久久国产九一剧情麻豆| 国产精一区二区三区| 免费xxxx18美国| 538国产精品一区二区免费视频| 午夜爽爽视频| 欧美视屏一区| 国产日产精品一区二区| 国产清纯白嫩初高生视频在线观看| 精品国产乱码久久久久久久久| 亚洲自拍偷拍一区二区三区| 偷拍区另类欧美激情日韩91| 国产欧美日韩综合精品一| 午夜wwww| 欧美一区二区三区四区在线观看| 96精品国产| 在线精品国产一区二区三区 | 久久天天躁夜夜躁狠狠躁2022| 午夜电影一区二区| 日日夜夜一区二区| freexxxx性| 国产精品麻豆一区二区|