日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]基于融合主題信息增強PU學習的事件相關新聞過濾的學習方法有效

專利信息
申請號: 202110347488.5 申請日: 2021-03-31
公開(公告)號: CN113641888B 公開(公告)日: 2023-08-29
發明(設計)人: 余正濤;王冠文;線巖團;張玉;黃于欣 申請(專利權)人: 昆明理工大學
主分類號: G06F16/9532 分類號: G06F16/9532;G06F40/30;G06F16/35;G06N3/0442;G06N3/0455;G06N3/0499;G06N3/088
代理公司: 昆明隆合知識產權代理事務所(普通合伙) 53220 代理人: 何嬌
地址: 650093 云*** 國省代碼: 云南;53
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 基于 融合 主題 信息 增強 pu 學習 事件 相關 新聞 過濾 學習方法
【權利要求書】:

1.基于融入主題信息增強PU學習的事件相關新聞過濾的學習方法,其特征在于:所述方法的具體步驟如下:

Step1、訓練分類器,同時加入無監督主題模型進行增強;

Step2、將未標注數據通過訓練的分類器模型進行預測,再將對未標注新聞的預測結果進行概率由高到低的排序;

所述步驟Step2的具體步驟為:

Step2.1、將數據集中剩余的未標注數據樣本通過分類器和主題模型進行類別的概率預測;預測結果是新聞屬于事件相關新聞的概率值;

Step2.2、將對未標注新聞的預測結果進行概率由高到低的排序,每次預測都會按照一定的迭代步幅獲取到概率靠前的數據作為可靠事件相關新聞樣本和概率靠后的數據作為可靠負樣本,并將這些樣本從未標注樣本中剔除,加入到訓練數據中,用以進行后續的迭代訓練過程;

Step3、初次的訓練和預測過程完成后,進行PU學習的迭代,即在新得到的訓練集上重新訓練分類器并重復整個預測和訓練過程;

Step4、將所有的樣本放入分類器進行訓練,得到所需要的事件相關新聞分類模型,基于事件相關新聞分類模型過濾出所需的事件相關新聞;

所述步驟Step1包括:

使用I-DNF算法進行非事件相關新聞數據提取,獲取到和初始事件相關新聞相同規模的反例,來訓練初始分類器,并加入無監督主題模型VAE進行增強;

其中,使用Embedding和雙向長短期記憶網絡BiLSTM的網絡結構作為分類器;

首先使用Embedding網絡層對輸入文本進行詞嵌入,得到詞嵌入向量其中n表示新聞文本長度,v為詞向量維度;此外,將輸入文本再通過VAE主題模型,得到新聞文本的主題向量其中m為預設主題個數,得到兩種編碼信息;

使用新聞文本的主題向量來對詞嵌入向量X進行指導;由于主題模型獲取到的主題向量是形狀為1*m的向量,將其復制n份,分別拼接到詞嵌入向量X后,形成的新矩陣X'就是融入主題向量的新聞編碼向量:

融入主題信息后的新聞編碼向量通過雙向長短期記憶網絡層BiLSTM來對其上下文關系進行建模,得到新聞語義表征向量,具體公式如下所示:

其中H為BiLSTM編碼后的句子向量,q是BiLSTM的隱含層維數,y表示最終的概率輸出。

2.根據權利要求1所述的基于融入主題信息增強PU學習的事件相關新聞過濾的學習方法,其特征在于:所述獲取到和初始事件相關新聞相同規模的反例的具體步驟如下:

Step1.1.1、一個文本特征在正例集合中出現頻率大于90%,而其在未標識集合出現的頻率僅有10%,就把這樣的特征當成正例的特征;

Step1.1.2、通過特征在正例集合和未標識集合中出現的頻率不同,建立一個正例特征集合;

Step1.1.3、未標識集合U中的樣例文檔未包含任何正例特征集合中的特征的,就把它從未標識集合U中抽取出來,標識成反例。

3.根據權利要求1所述的基于融入主題信息增強PU學習的事件相關新聞過濾的學習方法,其特征在于:所述步驟Step3的具體步驟為:

Step3.1完成初次的訓練和預測過程后,在新得到的訓練集上重新訓練分類器并重復整個預測和訓練過程;

Step3.2、每次迭代完成后,未標注數據的數量會隨之減少而訓練集的數量隨之增加,當未標注數據被完全預測為可靠樣本后,結束迭代過程。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于昆明理工大學,未經昆明理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202110347488.5/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产三级在线视频一区二区三区| 国产91久久久久久久免费| 国产特级淫片免费看| 一本大道久久a久久精品| 午夜剧场a级片| 欧美一区二区免费视频| 在线播放国产一区| 亚洲精品国产主播一区| 91黄色免费看| 91视频国产一区| 国产一区免费在线观看| 欧美日韩国产在线一区二区三区| 国产91电影在线观看| 国产91九色在线播放| 国产清纯白嫩初高生视频在线观看| 国产69精品久久久久777糖心| 亚洲欧美国产中文字幕| 91超碰caoporm国产香蕉| 91精品福利在线| 国产午夜精品一区二区理论影院 | 精品国产乱码一区二区三区在线| 欧美日韩精品在线一区二区| 久久密av| 国产精品欧美一区乱破| 99国产精品久久久久老师| 国产精品欧美一区乱破| 欧美一区二区三区免费观看视频| 亚洲国产精品精品| 毛片免费看看| 中文字幕在线乱码不卡二区区| 91在线一区| 日韩精品中文字幕一区| 国产高清在线观看一区| 911久久香蕉国产线看观看| 99久久精品一区二区| 国产精品电影一区二区三区| 国产精品一区在线播放| 夜夜爽av福利精品导航| 国产69精品久久久久999天美| 欧美精品中文字幕在线观看| 欧美日韩一区二区三区在线播放| a级片一区| 国产精品99999999| 亚洲国产一区二| 日本不卡精品| 欧美精品一区二区久久| 久久精品爱爱视频| 中文字幕区一区二| 国产日韩区| 国产一区二区精华| 国产精品日韩高清伦字幕搜索| 欧美一区二区三区免费看| 欧美国产一区二区在线| 欧美系列一区二区| 国产一级片网站| 538国产精品| 亚洲国产午夜片| 日韩av在线导航| 日韩一级免费视频| ass韩国白嫩pics| 日韩精品一二区| 精品一区电影国产| 小萝莉av| 国产大学生呻吟对白精彩在线| 亚洲高清乱码午夜电影网| 国产乱淫精品一区二区三区毛片| 欧美一区二区精品久久| 91理论片午午伦夜理片久久| 欧美xxxxxhd| 国产三级在线视频一区二区三区| 久久狠狠高潮亚洲精品| 日韩av在线影视| 91精品啪在线观看国产手机| 国产亚洲精品久久久久动| 国产视频二区在线观看| 6080日韩午夜伦伦午夜伦| 日本xxxxxxxxx68护士| 欧美综合在线一区| 午夜一级免费电影| 国产精品高潮呻吟久| 强行挺进女警紧窄湿润| 激情欧美日韩|