日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種基于LDA的學術資源獲取方法在審

專利信息
申請號: 201611128684.9 申請日: 2016-12-09
公開(公告)號: CN106777043A 公開(公告)日: 2017-05-31
發明(設計)人: 劉柏嵩;費晨杰;王洋洋;尹麗玲;高元 申請(專利權)人: 寧波大學
主分類號: G06F17/30 分類號: G06F17/30
代理公司: 寧波奧圣專利代理事務所(普通合伙)33226 代理人: 程曉明
地址: 315211 浙*** 國省代碼: 浙江;33
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 基于 lda 學術 資源 獲取 方法
【說明書】:

技術領域

本發明涉及機器學習、信息檢索和web網頁數據挖掘,尤其涉及一種基于LDA的學術資源獲取方法。

背景技術

隨著學術資源的電子化,從海量的學術資源中發現和挖掘研究者感興趣領域的學術資源漸漸成為一個研究的熱點。為了適應數字化的學術資源海量、多源異構的的特點,區別于傳統基于關鍵字詞頻的主題發現方法如共詞分析、引文分析等,一些基于機器學習和數據挖掘的新方法和模型不斷被應用到學術資源分類領域,比較典型的如潛在狄利克雷分配模型(latent Dirichlet allocation,LDA)、社會網絡分析(SNA)等,實踐發現這方法在學術資源主題發現方面取得了良好的效果。

網絡爬蟲是按照一定的規則,自動地抓取互聯網信息的程序或者腳本。主題爬蟲:是指選擇性地爬行那些與預先定義好的主題相關頁面的網絡爬蟲。主題是指某個定義好的專業領域或者興趣領域,例如航天航空,生物醫學,信息技術等,具體指一系列相關的詞所組成的集合。

LDA(Latent Dirichlet Allocation)是一種文檔主題生成模型,也稱為一個三層貝葉斯概率模型,包含詞、主題和文檔三層結構。所謂生成模型,就是說,我們認為一篇文章的每個詞都是通過“以一定概率選擇了某個主題,并從這個主題中以一定概率選擇某個詞語”這樣一個過程得到。文檔到主題服從多項式分布,主題到詞服從多項式分布。LDA是一種非監督機器學習技術,可以用來識別大規模文檔集(document collection)或語料庫(corpus)中潛藏的主題信息。它采用了詞袋(bag of words)的方法,這種方法將每一篇文檔視為一個詞頻向量,從而將文本信息轉化為了易于建模的數字信息。但是詞袋方法沒有考慮詞與詞之間的順序,這簡化了問題的復雜性,同時也為模型的改進提供了契機。每一篇文檔代表了一些主題所構成的一個概率分布,而每一個主題又代表了很多單詞所構成的一個概率分布。LDA主題模型是自然語言處理中主題挖掘的典型模型,可以從文本語料中抽取潛在的主題,提供一個量化研究主題的方法,已經被廣泛的應用到學術資源的主題發現中,如研究熱點挖掘、研究主題演化、研究趨勢預測等,從而設計成基于LDA主題模型的網頁主題爬蟲。從LDA目前應用的情況來看,目前各種獲取數字化學術資源(期刊論文、專利、碩博論文)的現有技術手段均存在一定局限性。

學術研究、技術開發需要獲取現有學術資源、技術信息,一般都是由各學術研究團隊或技術開發團隊的相關人員各自搜取,大量的重復搜取現象嚴重,搜取工作往往占用相關人員的大量時間精力。隨著互聯網的快速發展,網頁數量快速增長,但由于計算資源、網絡工具資源和存儲資源的有限,傳統搜索技術已經很難覆蓋大眾用戶的不同需求了。因此,智能化、個性化、領域化的搜索引擎技術應運而生,垂直搜索引擎的研究成為了時下的熱點研究方向。在搭建垂直搜索引擎之前,最重要的環節是如何利用主題爬蟲從浩瀚的互聯網中抓取到相關主題領域的信息內容,獲取目標主題領域準確而全面的學術資源信息。互聯網信息是在快速更新的,各學科也不斷出現新名詞、新概念、新思想;如何使主題爬蟲具有自學習功能,以適應互聯網信息的快速更新呢。

對文獻信息服務機構來說,如大學的圖書館、科技情報站等,獲取網上文獻信息為相關人員推送對應專業相關的資源成為重要工作。目前利用基于LDA的主題爬蟲獲取資源的方法,都是針對某個學術研究團隊或技術開發團隊的需求,設計的主題爬蟲被定義只對某個學術領域或技術領域,或者說針對單一主題進行抓取。在主題爬蟲一次爬行的時間段內只能提供單一領域或者說單一主題的學術或技術資源。那么,如何使主題爬蟲一次爬行同時獲取多個學術領域或技術領域或者說多個主題的學術或技術資源,以同時為多個學術研究團隊或技術開發團隊提供各自所需的學術或技術資源,同時又能保證學術或技術資源的對應性與資源范圍廣度滿足多個學術研究團隊或技術開發團隊提供各自所需。

本發明正是為了解決上述技術問題。

發明內容

本發明所要解決的技術問題是針對上述技術現狀,提供一種基于LDA的學術資源獲取方法。本發明針對現有技術存在的不足,在學術資源獲取方法方面提出基于LDA的學術資源主題爬蟲,爬蟲主題相似度計算采用VSM和SSRM相結合的方法,以更精準有效地在海量學術資源中獲取科研用戶最感興趣主題的相關資料。

本發明解決上述技術問題所采用的技術方案為:

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于寧波大學,未經寧波大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201611128684.9/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 欧美精品一卡二卡| 26uuu色噜噜精品一区二区| 午夜a电影| 国产精品96久久久久久又黄又硬| 91精品一二区| 免费xxxx18美国| 中文字幕av一区二区三区高| 日韩亚洲精品在线| 99久久99精品| 日本xxxxxxxxx68护士| 狠狠色噜噜狠狠狠狠综合久| 精品久久久综合| 午夜剧场a级片| 国产目拍亚洲精品区一区| 国产理论片午午午伦夜理片2021 | 国产精品欧美一区乱破| 97国产婷婷综合在线视频,| 中文字幕在线一二三区| 偷拍区另类欧美激情日韩91| 91波多野结衣| 91精品国产九九九久久久亚洲| 欧美性受xxxx狂喷水| 国产九九九精品视频| 久久精品一二三四| 在线国产一区二区三区| 国产一区二区高清视频| 狠狠色狠狠色很很综合很久久| 色妞www精品视频| 欧美日韩国产专区| 性欧美一区二区| 国产一区二区三区午夜| 国产91九色视频| 日本精品一二区| 国产一区二区中文字幕| 亚洲欧美日韩另类精品一区二区三区| 久久aⅴ国产欧美74aaa| 亚日韩精品| 国产一区日韩欧美| 亚洲国产精品国自产拍av| 久久久精品欧美一区二区免费| 国产欧美一区二区三区不卡高清| 激情aⅴ欧美一区二区三区| 免费的午夜毛片| 午夜电影理伦片2023在线观看| 香蕉av一区二区三区| 国产视频一区二区不卡| 久久99久国产精品黄毛片入口 | 色午夜影院| 国产精品一区二区麻豆| 精品国产乱码久久久久久免费| 日本高清二区| 老太脱裤子让老头玩xxxxx| 91精品久久久久久综合五月天| 久久天堂国产香蕉三区| 91精品一区二区在线观看| 狠狠插狠狠插| 久久乐国产精品| 蜜臀久久99精品久久久| 国产在线一卡| 国产一区二区黄| 亚洲麻豆一区| 欧美一区二区三区日本| 99爱精品视频| 精品国产免费久久| 国产精品伦一区二区三区视频| 国产欧美日韩va另类在线播放| 国产精品伦一区二区三区在线观看| 右手影院av| 亚洲一区二区三区加勒比| 国产日韩欧美精品一区二区| 999国产精品999久久久久久| 精品国产区| 国产精品99久久久久久宅男| 国产精品一区二区在线看| 国产女人和拘做受在线视频| 国产性猛交| 欧美国产精品久久| 日韩av一二三四区| 欧美一区二区三区国产精品| 在线国产一区二区| 国产精品香蕉在线的人| 视频一区二区中文字幕| 国产视频一区二区在线播放| 亚洲欧美另类国产| 日本黄页在线观看| 夜夜嗨av一区二区三区中文字幕 | 亚洲欧美另类国产| 国产一区=区| 国产欧美一区二区三区不卡高清| 国产亚洲精品综合一区| 综合色婷婷一区二区亚洲欧美国产| 国产视频一区二区不卡 | 97国产精品久久久| 亚洲1区在线观看| 中文字幕精品一区二区三区在线| 日韩精品一区二区中文字幕| 999亚洲国产精| 久久国产精品网站| 93久久精品日日躁夜夜躁欧美| 91亚洲欧美日韩精品久久奇米色| 国产在线视频二区| 欧美乱妇高清无乱码免费| 91精品久久久久久综合五月天| 国产日产欧美一区| 精品国产乱码久久久久久软件影片| 国产女性无套免费看网站| 国产不卡一二三区| 久久一区二| 91社区国产高清| 欧美亚洲精品suv一区| 精品欧美一区二区在线观看| 日韩av在线资源| 日韩精品一区二区三区免费观看| 久久96国产精品久久99软件| 91人人爽人人爽人人精88v| 欧美乱妇高清无乱码一级特黄| 99欧美精品| 久久综合激情网| 91久久精品国产91久久性色tv| 免费的午夜毛片| 一本一道久久a久久精品综合蜜臀 国产三级在线视频一区二区三区 日韩欧美中文字幕一区 | 日韩精品免费一区| 年轻bbwwbbww高潮| 欧美一区二区三区激情在线视频| 国产亚洲精品精品国产亚洲综合| 99热一区二区| 日韩一区免费| 福利电影一区二区三区| 国产午夜精品一区二区三区视频| 97视频久久久| 国产黄色网址大全| 欧美日韩亚洲另类| 亚洲精品一区二区三区香蕉| 精品一区中文字幕| 国产69精品久久久久777| 色婷婷综合久久久中文一区二区| 欧美激情精品一区| 四虎国产精品久久| 欧美色综合天天久久| 欧美精品日韩| 狠狠色噜噜狠狠狠狠米奇777| 欧美系列一区二区| 2023国产精品自产拍在线观看| 国产激情二区| 午夜看片网站| 国产精品免费不卡| 精品少妇的一区二区三区四区| 国产精品一区不卡| 色就是色欧美亚洲| 岛国黄色网址| 精品一区电影国产| 国产一区二区中文字幕| 99久久精品免费看国产免费粉嫩| 国产精品久久91| 91免费国产| 日日夜夜亚洲精品| 狠狠色噜噜狠狠狠狠视频| 在线精品国产一区二区三区| 高清国产一区二区| 午夜影院色| 久久久久久国产一区二区三区| 国产精品18久久久久久白浆动漫| 国产精品久久久视频| 精品视频在线一区二区三区| 97精品久久人人爽人人爽| 爱看av在线入口| 国产午夜一区二区三区| 欧美日韩一级在线观看| 国产资源一区二区三区| 国产激情视频一区二区| 国产一级片一区二区| 夜夜爱av| 日韩免费一级视频| 中文字幕制服丝袜一区二区三区| 最新av中文字幕| 国产一区二区三区乱码| 欧美精品一区二区三区四区在线 | 91精品国产九九九久久久亚洲| 午夜黄色一级电影| 国产婷婷一区二区三区久久| 欧美日韩中文字幕一区二区三区| 亚洲国产偷| 真实的国产乱xxxx在线91| 国产精品美女www爽爽爽视频| 国产资源一区二区三区| 午夜影院一区二区| 国产精品5区| 日韩一级片免费视频| 国产另类一区| 国产精品免费不卡| 亚洲精品一区中文字幕| 日本一区午夜艳熟免费| 国产女人和拘做受在线视频| 精品无码久久久久国产| 欧美亚洲视频一区二区| 久久一二区| 香港三日三级少妇三级99| 日韩精品福利片午夜免费观看| 少妇自拍一区| 一区二区三区国产欧美| 日日夜夜一区二区| 久久久精品视频在线| 欧美性二区| 国产精品爽到爆呻吟高潮不挺| 国产91清纯白嫩初高中在线观看| 国产伦高清一区二区三区| 国产午夜精品一区二区理论影院| 日韩一区免费在线观看| 国产88av| 国产女人和拘做受在线视频| 亚洲乱亚洲乱妇50p| 亚洲乱小说| 狠狠色综合久久婷婷色天使| 国产欧美日韩亚洲另类第一第二页| 久久一二区| 亚洲一区二区三区加勒比| 鲁一鲁一鲁一鲁一鲁一av| 欧美一区二区久久久| 国产精品自产拍在线观看桃花| 91麻豆精品国产综合久久久久久| 88国产精品视频一区二区三区| av毛片精品| 国产精品一二三区视频网站| 国产精品一区二区毛茸茸| 国产精品一二三区视频网站| 精品久久小视频| 日本二区在线观看| 97精品久久久午夜一区二区三区| 午夜天堂在线| 国产精品九九九九九九九| 久久精品国语| 99国产精品| 国产999精品视频| 91avpro| 亚洲午夜久久久久久久久电影院| 久久精品手机视频| 午夜片在线| 久久久久亚洲国产精品| 国产伦精品一区二区三区电影| 免费的午夜毛片| 又色又爽又大免费区欧美| 美女张开腿黄网站免费| 精品少妇一区二区三区 | 国产精品尤物麻豆一区二区三区| 一级黄色片免费网站| 国产精品18久久久久久白浆动漫|