日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]基于TF-IDF和領域詞典的主題內容聚合分析方法有效

專利信息
申請號: 201910359911.6 申請日: 2019-04-30
公開(公告)號: CN110110047B 公開(公告)日: 2021-03-19
發明(設計)人: 趙瑞雪;寇遠濤;張潔;鮮國建;仲躋亮 申請(專利權)人: 中國農業科學院農業信息研究所
主分類號: G06F16/33 分類號: G06F16/33;G06F16/335;G06F16/35
代理公司: 暫無信息 代理人: 暫無信息
地址: 100081 北*** 國省代碼: 北京;11
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 基于 tf idf 領域 詞典 主題 內容 聚合 分析 方法
【權利要求書】:

1.一種基于TF-idf和領域詞典的主題內容聚合分析方法,其特征在于,包含如下步驟:

步驟S1:獲取用于主題聚合的指定領域和1個初始需求詞,并根據初始需求詞指定領域詞典;

領域詞典建立在所指定領域的科學敘詞表基礎上,科學敘詞表包含所指定領域的敘詞、非敘詞以及詞間語義關系;

步驟S2:對初始需求詞擴展,得到正式擴展詞集,包括如下步驟:

S2-1:語料資源召回

使用步驟S1確定的初始需求詞,在原始語料資源庫中通過檢索,召回K個最相關的資源,作為命中結果集;

此處,原始語料資源庫指從資源池中抽取出來的期刊資源,這些資源的關鍵字段齊全且沒有異常字符,所述關鍵字段包括:標題、關鍵詞、摘要、作者、來源期刊和作者機構;K取值為正整數,該參數決定了進入步驟S2-2語料遴選階段的資源數量;所述資源池是指通過自建或購買匯聚而成的電子資源集合;

S2-2:語料遴選

抽取命中結果集中各資源的關鍵字段,包括:標題、關鍵詞、摘要、作者、來源期刊和作者機構,作為關鍵字段對象集合;

S2-3:語料分詞

將上一步抽取出來的關鍵字段對象集合進行碎片化,根據預先設置的分詞粒度參數和分詞策略,形成文本碎片詞集;

S2-4:詞集過濾

使用停用詞表和生活常用詞表對文本碎片詞集進行過濾:

將文本碎片詞集中,隸屬于停用詞表和生活常用詞表的詞項提取出,然后將這些詞項逐個與核心期刊關鍵詞表對比;若其隸屬于核心期刊關鍵詞表,則將其保留在文本碎片詞集中,若其不屬于核心期刊關鍵詞表,則從文本碎片詞集中去除該詞項;所述核心期刊關鍵詞表,由從原始語料資源庫中的核心期刊收錄文章的關鍵字段構成;

將文本碎片詞集保留下來的所有詞項的集合稱為候選擴展詞集合A′;

S2-5:特征詞提取

利用TF-IDF算法,對候選擴展詞集合A′中的每個詞項,計算其與初始需求詞的相關度,作為該詞項對整個候選擴展詞集合A′的重要性程度,設第n個詞項對A′的重要性程度為wn;然后將重要性程度wn從大到小降序排列,提取出wn值最大的前M個詞項作為特征詞,這些特征詞構成正式擴展詞集A;

其中,M為預先設置參數,表示正式擴展詞集A中的詞項個數,且取值為正整數;

所述重要性程度計算公式為:

TFn指第n個詞項在集合A′中出現的詞頻,fn為第n個詞項在集合A′中出現的次數,fd為集合A′中的詞項總個數;log為取對數運算;

IDFn則是第n個詞項在集合A′中的逆向詞頻指數,其中K為步驟S2-1預設的參數,Kn為K條資源中包含有第n個詞項的資源數量;

步驟S3:通過檢索建立備選資源集,包括如下步驟;

S3-1:檢索詞擴展

將步驟S2-5得到的正式擴展詞集A中各詞項基于領域詞典進行擴展,即依據該領域詞典對應的科學敘詞表中英對照及“用代屬分參”語義關系對各詞項進行上下位、統一詞及中英對照詞的擴展,并去掉其中的重復詞項,生成正式檢索詞集B;

S3-2:檢索詞拼接

將正式檢索詞集B中的各詞項拼接成為檢索詞串,作為檢索輸入文本,檢索詞串的拼接規則為詞項之間以“或”運算符連接;

S3-3:資源結果召回

首先確定檢索涉及的目標資源類型,然后對每種目標資源類型指定相應的關鍵字段,將關鍵字段設置為該種目標資源類型的默認檢索字段,使用步驟S3-2中獲取到的檢索詞串,在資源池中進行檢索時,只在每個資源的默認檢索字段進行檢索,若該資源的默認檢索字段中包括正式檢索詞集B中的1個或多個詞項,則將該資源納入備選資源集;

所述目標資源類型,包括新聞資訊、中文期刊、外文期刊、OA期刊、領域專家和科研成果;

步驟S4:審核及快速補充,排序后獲得最終正式主題結果集

對上述步驟中得到的備選資源集進行審核及補充,形成最終正式主題結果集;包括如下步驟:

S4-1:對備選資源集中各資源按照如下標準進行審核:

(1)根據S3-3中該資源所屬的目標資源類型相應的關鍵字段,查看該資源的關鍵字段均不為空;

(2)該資源的全部內容無異常字符;

符合以上標準的資源則通過審核,納入候選主題結果集;當有異常字符的情況下若通過修改可消除的,則修改后也將其納入候選主題結果集;

S4-2補錄新增資源

對每種目標資源類型建立相應的錄入模板,所述錄入模板指每個類型的資源必填的字段和非必填的字段;

對資源池外其他的與初始需求詞高度相關的資源,若擬將其作為新增資源,則首先根據該資源所屬的目標資源類型選擇相應的錄入模板,并按照錄入模板錄入相應的內容,至少應在對應的錄入模板中錄入所要求必填的字段;

S4-3新增資源導入

將完成錄入的新增資源的關鍵字段與候選主題結果集中的資源的關鍵字段進行比對,以排除重復的資源;若非重復資源則將其納入到候選主題結果集;

S4-4:結果排序

對每種目標資源類型,根據資源的時效性、權威性及相關度,對步驟S4-3獲得的候選主題結果集中的資源進行有序排列,獲得最終正式主題結果集;

步驟S5:將最終正式主題結果集進行發布,發布時根據不同目標資源類型,按照步驟S4-4獲得的排序進行展示。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國農業科學院農業信息研究所,未經中國農業科學院農業信息研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201910359911.6/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产一区二| 2020国产精品自拍| 日韩一级片免费视频| 日日夜夜亚洲精品| 精品国产一区二区三区免费| 91久久国产视频| 国产一区二区三区色噜噜小说| 8x8x国产一区二区三区精品推荐| 亚洲国产精品肉丝袜久久| 狠狠躁夜夜| 美女销魂免费一区二区| 欧美性二区| 狠狠色噜噜狠狠狠狠69| 亚洲欧洲日韩在线| 日本一二三区电影| 视频一区二区中文字幕| 欧美激情视频一区二区三区| 亚洲一区欧美| 日本一区二区在线电影| 国产无套精品一区二区| 国产区二区| 国产性猛交| 亚洲欧美一区二区三区1000| 狠狠色狠狠色综合婷婷tag| 国产欧美久久一区二区三区| 久久99久久99精品免观看软件 | 欧美一区二区综合| 国内久久久| 国产精品视频二区不卡| 日韩av一区不卡| 中文字幕一区二区三区免费| 国产免费一区二区三区网站免费| 国产女人和拘做受在线视频| 午夜一级电影| 91久久久久久亚洲精品禁果| 狠狠躁夜夜躁| 日本高清一二三区| 精品国产区| 国产一区二区精品在线| 日韩亚洲欧美一区| 欧美一区二区激情三区| 中文字幕区一区二| 国产综合亚洲精品| 久久影视一区二区| 国产伦高清一区二区三区| 国产一区二区在线91| 欧美在线观看视频一区二区三区| 性视频一区二区三区| 中文字幕一区二区三区免费视频| 国产精品麻豆一区二区三区| 午夜精品一区二区三区在线播放| 强制中出し~大桥未久4| 99精品欧美一区二区| 久久99精品国产麻豆婷婷| 狠狠插狠狠插| 日韩av免费网站| 午夜国产一区| 激情久久一区二区| 91热国产| 午夜天堂电影| 亚洲精品456| 国产午夜精品免费一区二区三区视频 | 夜夜爽av福利精品导航| 狠狠色狠狠色很很综合很久久| 中文乱码在线视频| 日本高清h色视频在线观看| 欧美日韩一区二区电影| 国产91高清| 激情欧美一区二区三区| 精品中文久久| 国产在线拍偷自揄拍视频 | www亚洲精品| 亚洲国产精品日本| 狠狠色噜噜狠狠狠狠2021免费| 国产日韩欧美综合在线| 日韩av一二三四区| 国产伦理一区| 国产亚洲精品久久午夜玫瑰园| 国产第一区二区三区| 国模精品免费看久久久| 首页亚洲欧美制服丝腿| 国产区一区| 日本护士hd高潮护士| 午夜剧场a级片| 欧美69精品久久久久久不卡| 国产大片一区二区三区| 欧美片一区二区| 99日韩精品视频| 91久久一区二区| 国产日产高清欧美一区二区三区| 国产精品第56页| 国产欧美一区二区三区在线看| 538在线一区二区精品国产| 一区二区三区欧美视频| 国产精品一区一区三区| 一区二区三区欧美在线| 香港三日三级少妇三级99| 欧美一区二区性放荡片| 国产视频在线一区二区| 日本午夜精品一区二区三区| 久久国产精品精品国产| 狠狠干一区| 国产乱淫精品一区二区三区毛片| 91高清一区| 国产在线不卡一区| 国产精品国产三级国产aⅴ下载| 日本一二三区电影| 久久精品综合| 99久久精品一区二区| 亚洲精品国产主播一区| 精品三级一区二区| 日韩亚洲欧美一区| 欧美乱妇在线观看| 欧美精品一卡二卡| 国产97在线播放| 欧美67sexhd| 国产一区在线精品| 国产一区二区三区精品在线| 中文乱幕日产无线码1区| 国产欧美精品一区二区在线播放| 日本精品一二三区| 99国产精品9| 91一区二区三区在线| 国产一区二区在| 午夜天堂在线| 午夜激情在线播放| 少妇久久精品一区二区夜夜嗨| 在线精品视频一区| 国模少妇一区二区三区| 久久国产精品网站| 日韩av免费电影| 97精品超碰一区二区三区| 制服丝袜二区| 好吊色欧美一区二区三区视频| 国产欧美精品一区二区在线播放| 91黄色免费看| 欧美日韩精品在线一区| 国产午夜一级一片免费播放| 在线亚洲精品| 久久午夜精品福利一区二区| 午夜影院黄色片| 狠狠操很很干| 亚洲国产精品肉丝袜久久| 狠狠色综合久久婷婷色天使| 夜夜精品视频一区二区| 国产精品九九九九九| 亚洲1区在线观看| 午夜激情看片| 欧美日韩偷拍一区| 日韩区欧美久久久无人区| 日本精品一区二区三区在线观看视频 | 欧美日韩亚洲三区| 国产91电影在线观看| 国产伦精品一区二区三| 久久中文一区二区| 99精品国产一区二区三区不卡 | 欧美久久精品一级c片| 国产精品入口麻豆九色| 色噜噜日韩精品欧美一区二区| 日本精品视频一区二区三区| 日本护士hd高潮护士| 亚洲精品久久久久中文字幕欢迎你| 国产午夜精品一区二区理论影院| 99视频国产精品| 亚洲精品卡一卡二| 少妇自拍一区| 国产一区网址| 91麻豆精品国产91久久久更新时间| 欧美日韩国产影院| 91波多野结衣| 国产不卡一区在线| 国产一区免费在线| а√天堂8资源中文在线| 国产一区二区资源| 欧美日韩一区在线视频| 性欧美精品动漫| 国产日韩欧美三级| 亚洲欧洲一区| 欧美系列一区二区| 视频二区狠狠色视频| 国产欧美一区二区三区不卡高清| 国产精品刺激对白麻豆99| 中文字幕久久精品一区| 精品国产一区二区在线| 欧美日韩一区二区电影| 精品国产九九九| 国产日韩欧美自拍| 99爱精品视频| 欧美三级午夜理伦三级中视频| 99国产精品| 国产欧美日韩精品一区二区图片| 亚洲精品www久久久| 欧美日韩一区二区高清| 亚洲精品人| 国产97在线播放| 99国产精品一区| 国产性猛交96| 国产天堂第一区| 三级视频一区| 日本一二三区视频在线| 久久99精品一区二区三区| 亚洲欧美日韩精品在线观看| 99精品一区| 欧美日韩国产精品综合| 国产午夜三级一二三区| 99久久精品国产系列| 国产精品一卡二卡在线观看| 国产精品日韩电影| 国产原创一区二区 | 欧美日韩一区免费| 国产二区视频在线播放| 偷拍久久精品视频| 欧美精品九九| 久久天天躁狠狠躁亚洲综合公司| 91视频一区二区三区| yy6080影院旧里番乳色吐息| 精品久久小视频| 午夜特片网| 少妇av一区二区三区| 福利片91| 亚洲欧美另类综合| 国产日韩欧美亚洲| 国产一区www| 免费a一毛片| 国产女人和拘做受视频免费| 国产精品丝袜综合区另类| 国产精品一区二区麻豆| 久久五月精品| 日本免费电影一区二区三区| 国产清纯白嫩初高生在线观看性色| 国产一二区在线观看| 国产欧美一二三区| 国产精品亚洲精品一区二区三区 | 欧美精品在线视频观看| 一区二区中文字幕在线| 中文字幕天天躁日日躁狠狠躁免费| 亚洲精品乱码久久久久久高潮| 国产亚洲精品久久久456| 国产精品你懂的在线| 国产91免费在线| av不卡一区二区三区| 亚洲精华国产欧美| 国产精品视频久久久久久久| 国产欧美精品久久| 久久夜色精品亚洲噜噜国产mv| 肥大bbwbbwbbw高潮|