日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種基于自然語言處理的層次化專題屬性抽取方法有效

專利信息
申請號: 201811005109.9 申請日: 2018-08-30
公開(公告)號: CN109145089B 公開(公告)日: 2021-07-30
發明(設計)人: 梁勇奇;楊瑞霞;耿同 申請(專利權)人: 中國科學院遙感與數字地球研究所
主分類號: G06F16/33 分類號: G06F16/33;G06F16/35;G06F16/36
代理公司: 北京億騰知識產權代理事務所(普通合伙) 11309 代理人: 陳霽
地址: 100094*** 國省代碼: 北京;11
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 基于 自然語言 處理 層次 專題 屬性 抽取 方法
【權利要求書】:

1.一種基于自然語言處理的層次化專題屬性抽取方法,包括以下步驟:

1)將英文百科類介紹頁面結構化,清洗并句子化,形成總句子語料庫;

2)從總句子語料庫中隨機抽取部分句子,標注其中含有某專業領域屬性的句子,形成句子層的語料庫——屬性句子語料庫;

3)按照7:3的比例,將屬性句子語料庫劃分為訓練庫和檢驗庫,訓練并檢驗隨機森林分類器;

4)使用訓練好的隨機森林分類器對步驟1)中的總句子語料庫分類,獲得屬性句子庫;

5)使用文檔主題生成模型獲取屬性句子庫中的主題詞,標注該專業領域知識的各類型屬性詞,形成詞語層的語料庫——屬性詞語料庫;

6)將英文百科類介紹頁面詞語化,根據屬性詞語料庫,規則匹配抽取專題屬性信息。

2.根據權利要求1所述的基于自然語言處理的層次化專題屬性抽取方法,其特征在于:所述步驟1)進一步包括:

1.1)使用標題和段落的結構,濾除百科介紹頁面中的目錄、相關鏈接、擴展閱讀、參考等冗余信息,形成結構化的網頁文檔;

1.2)使用Python庫中的nltk自然語言處理包清洗,并句子化網頁文檔,形成總句子庫,其中清洗部分包括去特殊符號和詞性還原。

3.根據權利要求2所述的基于自然語言處理的層次化專題屬性抽取方法,其特征在于:所述步驟2)進一步包括:

2.1)隨機抽取1/5的句子,根據句子中是否含有專業領域所需的屬性信息,逐條人工標注為屬性句子語料庫, 至此,完成第一個層次的語料庫構建。

4.根據權利要求3所述的基于自然語言處理的層次化專題屬性抽取方法,其特征在于:所述步驟3)進一步包括:

3.1)從屬性句子庫中隨機選取1/5、2/5、3/5、4/5的句子,按照7:3的比例劃分為訓練庫和檢驗庫;

3.2)分別使用BOW模型(Bag of word)、TF-IDF模型(Term frequency–inversedocument frequency)、FH模型(feature hashing)將3.1)中的屬性句子語料訓練庫和檢驗庫中的句子轉換為詞向量;

3.3)從Python庫的scikit-learn機器學習包中調用12種分類器的函數,使用3.2)中的訓練庫和檢驗庫的詞向量訓練和檢驗,得到共計4×3×12種組合的結果。

5.根據權利要求4所述的基于自然語言處理的層次化專題屬性抽取方法,其特征在于:所述步驟4)進一步包括:

4.1)選取3.3)中分類結果最優的隨機森林分類器,對1.2)中的總句子庫分類,得到屬性句子總語料庫。

6.根據權利要求5所述的基于自然語言處理的層次化專題屬性抽取方法,其特征在于:所述步驟5)進一步包括:

5.1)使用Python庫中gensim文檔主題分析包提供的主題分析模型LSI(Latentsemantic indexing)、LDA(Latent Dirichlet allocation)和Scikit-learn機器學習包提供的主題分析模型LDA(Latent Dirichlet allocation)、NMF(Non-negative matrixfactorization),設置不同的主題數量,分別對4.1)中的屬性句子總語料庫進行主題分析,在每個確定的主題數量下,對比這4種分析模型的結果,最后選定的關鍵詞庫為gensim提供的LDA模型和scikit-learn提供的NMF模型分析得到的關鍵詞庫的并集;

5.2)根據該專業領域的專題,從步驟5.1)主題分析模型(LDA和NMF)獲得的關鍵詞庫中,人工標注相關的屬性信息詞,按照專業鄰域的知識劃分類型,形成屬性詞語料庫, 至此,完成第二個層次的語料庫構建。

7.根據權利要求6所述的基于自然語言處理的層次化專題屬性抽取方法,其特征在于:所述步驟6)進一步包括:

6.1)使用Python庫中的nltk自然語言處理包清洗,并詞語化步驟1.1)中結構化的網頁文檔,其中清洗包括去停頓詞、去特殊符號和詞性還原,形成詞語總庫;

6.2)使用步驟5.2)中的屬性詞語料庫,在步驟6.1)中的詞語總庫規則匹配,完成該專題屬性信息的抽取,形成專業領域的屬性信息數據集。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院遙感與數字地球研究所,未經中國科學院遙感與數字地球研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201811005109.9/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 狠狠色噜噜狠狠狠四色米奇| 色综合久久精品| 国产日韩欧美网站| 午夜国产一区二区三区四区| 国产日产高清欧美一区二区三区| 九九久久国产精品| 年轻bbwwbbww高潮| 久久中文一区| 国产精品国产三级国产播12软件 | 国产精品亚洲第一区| 亚洲欧洲日韩在线| 亚洲欧美日韩另类精品一区二区三区| 亚洲v欧美v另类v综合v日韩v| 国产天堂一区二区三区| 国产精品一二三四五区| 99精品久久久久久久婷婷| 91精品美女| 美女直播一区二区三区| 国产一区二区三区中文字幕| 日本精品一区二区三区在线观看视频| 精品国产一区二区在线| 狠狠躁日日躁狂躁夜夜躁av| 国偷自产一区二区三区在线观看| 久久国产麻豆| 日韩av在线导航| 欧美精品一区二区三区视频| 欧美69精品久久久久久不卡| 亚洲精品久久久久中文第一暮| 99久久国产综合精品色伊| 国久久久久久| 日韩精品999| 一区二区在线视频免费观看| 97人人模人人爽人人喊小说| 99久久婷婷国产综合精品草原| 国产理论一区二区三区| 日本高清不卡二区| 欧美一区二区三区在线视频播放| 欧美在线视频一区二区三区| 狠狠躁夜夜躁人人爽天天天天97 | 国产人成看黄久久久久久久久| 久久精视频| 国产欧美日韩在线观看| 亚洲伊人久久影院| 国产日韩欧美91| 午夜激情看片| 国产一区二区黄| 国产91九色视频| 国产电影精品一区二区三区| 狠狠色噜噜狠狠狠狠| www色视频岛国| 久久久久亚洲最大xxxx| 久久综合二区| 96精品国产| 亚洲va国产2019| 亚洲国产aⅴ精品一区二区16| 国产综合久久精品| 国产精品久久久综合久尹人久久9| 三级视频一区| 亚洲三区二区一区| 亚洲欧美一卡二卡| 国产精品人人爽人人做av片| 精品国产一区二区三区麻豆免费观看完整版 | 岛国精品一区二区| 国产精品欧美日韩在线| 999久久久国产| 日本一区二区免费电影| 国产亚洲精品久久yy50| 国产伦理久久精品久久久久| 国产精品综合在线| 欧美一区二区三区免费电影| 思思久久96热在精品国产| 国产精品久久久久久亚洲美女高潮| 欧美日韩一区免费| 国产91精品一区| 国产精品麻豆一区二区| 日韩欧美国产高清91| 在线国产一区二区| 国产suv精品一区二区4| 亚洲欧洲一区| 91一区二区三区在线| 国产精品乱码一区| 国产二区免费视频| 国产精品天堂| 在线精品视频一区| 欧美一区二区久久| 欧美日韩国产三区| 国产日韩欧美精品一区| 国产主播啪啪| 2023国产精品自产拍在线观看| 日韩欧美高清一区| 自拍偷在线精品自拍偷无码专区 | 国产一级一区二区三区| 久久九精品| 99re国产精品视频| 欧美激情国产一区| 国产国产精品久久久久| 久久久综合香蕉尹人综合网| 欧美高清性xxxx| 一区二区欧美精品| 免费精品99久久国产综合精品应用| 亚洲国产一区二区精品| 国产精品乱码久久久久久久| 亚洲精品www久久久| 97人人模人人爽人人喊小说| 91精品国模一区二区三区| 国产精品麻豆一区二区三区| 91av一区二区三区| 国产精品刺激对白麻豆99| 北条麻妃久久99精品| 久久久精品中文| 97久久超碰国产精品| 亚洲第一区国产精品| 99热一区二区| 欧美系列一区二区| 欧美在线一级va免费观看| 日本一二三区视频在线| 午夜国产一区二区三区四区| 久久夜色精品久久噜噜亚| 欧美乱偷一区二区三区在线| 欧美一区二区三区免费在线观看| 久久精品一区二区三区电影| 亚洲精品无吗| 欧美激情精品久久久久久免费| 国产一区二区国产| 91精品国产九九九久久久亚洲| 一区二区三区欧美日韩| 88国产精品欧美一区二区三区三| 99久久免费精品视频| 在线视频不卡一区| 欧美乱妇在线视频播放| 亚洲国产欧美一区二区丝袜黑人| 91视频一区二区三区| 视频国产一区二区| 99精品视频一区| 久久久久国产精品免费免费搜索| 国产91精品一区二区麻豆亚洲| 亚洲国产精品97久久无色| 国产一区亚洲一区| 久久午夜鲁丝片午夜精品| 亚洲天堂国产精品| 日韩一区高清| 狠狠色噜噜狠狠狠狠69| 国产精品白浆一区二区| 电影午夜精品一区二区三区| 亚洲欧美国产一区二区三区| 久久国产欧美日韩精品| 亚洲精品乱码久久久久久高潮| 亚洲少妇中文字幕| 精品国产乱码久久久久久免费| 色噜噜狠狠色综合久| free性欧美hd另类丰满| 91麻豆国产自产在线观看hd| 少妇高潮一区二区三区99小说| 国产丝袜一区二区三区免费视频| 免费xxxx18美国| 亚洲精品人| 日本一区午夜艳熟免费| 波多野结衣巨乳女教师| 日本午夜一区二区| 国产精品一区二区久久乐夜夜嗨| 国产精品99在线播放| 国产精品久久免费视频在线| 夜夜嗨av一区二区三区中文字幕| 91人人爽人人爽人人精88v | 免费看欧美中韩毛片影院| 国产欧美精品一区二区三区-老狼| 91精品婷婷国产综合久久竹菊 | 日本一区二区在线电影| 国产在线一区二区视频| 91亚洲精品国偷拍自产| 97人人澡人人爽91综合色| 性国产日韩欧美一区二区在线| 日本美女视频一区二区| 国模精品免费看久久久| 中文字幕日本精品一区二区三区| 中文字幕一区二区三区乱码| 夜夜嗨av禁果av粉嫩av懂色av| 午夜影院一区| 国产一级一片免费播放| 国产一区免费播放| 亚洲国产99| 一级女性全黄久久生活片免费| 日韩一级精品视频在线观看| 国产欧美视频一区二区| 亚洲乱子伦| 色午夜影院| 麻豆精品一区二区三区在线观看| 香蕉av一区| 欧美国产三区| 久久综合激情网| 99久久婷婷国产精品综合| 日韩精品一区二区三区免费观看| 国产精品麻豆自拍| 精品国产品香蕉在线| 国产一区二区伦理| 一区二区三区欧美日韩| 91精品国产高清一二三四区| 96精品国产| 欧美精品一区久久| 久久久久久久久亚洲精品一牛| 国产乱人伦精品一区二区| 综合久久激情| 17c国产精品一区二区| 国产欧美日韩一区二区三区四区 | 国产第一区二区| 国产区二区| 亚洲乱码一区二区三区三上悠亚| 久久国产精品网站| 中文字幕天天躁日日躁狠狠躁免费 | 91精品美女| 国产精品国产三级国产专区55 | 久久久久国产精品一区二区三区| 久久99国产精品久久99| 国产精品19乱码一区二区三区| 国产日韩精品一区二区三区| 亚洲欧美一卡二卡| 日韩av一区二区在线播放 | 亚洲乱亚洲乱妇50p| 国产日韩欧美自拍| 国产超碰人人模人人爽人人添| av午夜剧场| 免费精品一区二区三区视频日产| 国产精品天堂网| 激情久久一区| 国产88在线观看入口| 国产精品久久久久久久久久久久久久久久久久 | 国产1区2区3区| 午夜国产一区| 午夜欧美a级理论片915影院| 精品久久9999| 免费看片一区二区三区| 国产视频一区二区视频| 日韩a一级欧美一级在线播放| 麻豆精品国产入口| 狠狠色噜噜狠狠狠四色米奇| 国产精品一区在线观看| 97人人澡人人添人人爽超碰| 国产欧美www| 处破大全欧美破苞二十三| 91久久国产视频| 国产午夜精品一区二区三区欧美| 伊人久久婷婷色综合98网| 久久噜噜少妇网站| 国产精品理人伦一区二区三区 | 一区二区欧美视频| 国产精品一区二区av麻豆|