日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種基于PLSA主題模型和EM算法確定網頁元素主題的方法有效

專利信息
申請號: 202010185732.8 申請日: 2020-03-17
公開(公告)號: CN111459806B 公開(公告)日: 2022-09-23
發明(設計)人: 楊龍祥;賈秀秀;劉玉珍 申請(專利權)人: 南京郵電大學
主分類號: G06F11/36 分類號: G06F11/36;G06F16/958
代理公司: 南京蘇高專利商標事務所(普通合伙) 32204 代理人: 王恒靜
地址: 210003 江蘇*** 國省代碼: 江蘇;32
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 基于 plsa 主題 模型 em 算法 確定 網頁 元素 方法
【權利要求書】:

1.一種基于PLSA主題模型和EM算法確定網頁元素主題的方法,其特征在于,該方法包括以下步驟:

(1)選取待測網頁的網頁元素對應的主題,找出主題關鍵詞集合和主題集合;

(2)對待測網頁的網頁元素進行預處理,生成元素-詞的關系;

(3)根據獲取到的所述主題集合,按照PLSA模型公式訓練出主題-詞矩陣以及網頁元素-主題矩陣,

(4)采用改進的EM算法求解出網頁元素中對應概率最大的主題,作為該網頁元素的主題;

(5)當網頁結構或元素屬性改變而造成網頁狀態變化后,重新獲取當前DOM,重新對當前網頁內的網頁元素的主題進行判定,并生成網頁元素XPath定位器;

所述步驟(2),具體包括:

(21)從待測網頁的網頁元素與主題相關聯的屬性值中篩選主題關鍵詞集合中的關鍵詞以及網頁元素的主題關鍵詞,該主題下的所有網頁元素樣本關鍵詞組成的集合就是主題關鍵詞集合;

(22)計算各個主題關鍵詞的頻率,具體為:待測網頁的網頁元素e中主題關鍵詞w出現的頻率表示為:

其中,nw代表網頁元素e中關鍵詞w出現的次數,ne代表網頁元素e中全部關鍵詞的出現次數;

所述步驟(3)具體包括:

(31)根據得到的主題關鍵詞集合W,網頁元素集合E,主題集合T,根據PLSA模型公式訓練出主題-詞P(wj|tk)和網頁元素-主題P(tk|ei);

(32)計算網頁元素中的生成概率,如下式所示:

其中,P(ei)為待測網頁中某網頁元素ei的概率,P(wj|tk)為主題關鍵詞wj在給定的主題tk中出現的概率,P(tk|ei)為主題tk在給定的網頁元素ei中出現的概率;n為待測網頁中主題的總數,P(tk|ei)和P(wj|tk)是未知量,故θ=(P(wj|tk),P(tk|ei))就是需要估計的參數值,并且使得最大化θ值;

所述改進的EM算法包括:

(41)計算Q函數:

其中,觀測數據集合Ym=(w0i,w1i),若yi來自額外的0,記w0i=1,否則w0i=0;同樣的yi若來自額外1,記w1i=1,否則w1i=0,這樣就給出完全數據集,其中Y0=(yi,Xi,Zi)為觀測數據,X和Z是協變量集合;β和γ01是回歸系數,記表示在第t步迭代中參數θ估計的當前值;表示期望值的計算是在條件分布下算出的;分別表示數據中參數0、1和2所占總體數據的比例;

而且有:

(42)將觀測數據集分為子集Y01,Y02,劃分的規則:把每個觀測隨機的分到兩個子集Y01,Y02的兩者的任意一個中去;

(43)接下來在兩個樣本集Y01,Y02將Q函數極大化,利用條件極大化的辦法實現;利用迭代方程得到:

具體的如下:

令則

同樣的

重復(42)和(43)步,直到算法收斂得到全局最優解;

所述步驟(4)中,采用改進的EM算法求解出網頁元素中對應概率最大的主題,具體包括:

(44)對θ進行迭代進行極大似然估計,如下式所示:

其中,n為迭代θ的次數,L為網頁元素樣本集的詞分布的對數似然函數;

(45)主題-詞P(wj|tk)的概率和等于1,網頁元素-主題P(tk|ei)的概率和等于1:

(46)由于關鍵詞之間相互獨立,所以網頁元素的詞分布如下式所示:

故網頁元素樣本集的詞分布的對數似然函數,如下式所示:

其中,n(ei)代表網頁元素e中全部關鍵詞的出現次數,其有取值范圍,每次取的值不同,會有一個編號來表示,M、N、K就是取值的最大值,n(ei)就是從1取到這個最大值,n(wj,ei)表示詞wj在網頁元素ei中出現的次數、P(ei,wj)是詞wj在網頁元素ei中的詞頻率;

(47)接下來將網頁元素樣本集的詞分布對數似然函數l(θ)代入式(7)中,通過條件極大化的方法對L(θ)函數極大化,得到在第k步迭代中參數θ隨機部的估計當前值,也即是參數θ隨機部的全局最優解;

(48)計算此時t的后驗概率,利用貝葉斯公式,得到如下:

(49)將計算得到的t代入式(8),求解相應的P(wj|tk)和P(tk|ei)

由于n(ei)∝P(ei),簡化公式(17),由于式(15)得到參數θ隨機部的全局最優解,接下來的計算max l(θ)就轉化為一個優化問題;

對應的目標函數為:

約束條件為:

(410)采用拉格朗日乘數法,估算得到P(wj|tk)和P(tk|ei);

(411)把P(wj|tk)和P(tk|ei)再代入公式(16),循環迭代得到隱變量主題t的后驗概率P(tk|ei,wj)

其中,P(tk|ei)代表網頁元素的主題分布,進而把網頁元素ei對應概率最大的主題tk作為該網頁元素的主題。

2.根據權利要求1所述的基于PLSA主題模型和EM算法確定網頁元素主題的方法,其特征在于,所述步驟(1)中,找出主題關鍵詞集合和主題集合包括:

使用網絡爬蟲技術模擬瀏覽器獲取待測網頁的源代碼,再進行解析HTML代碼,得到網頁元素的主題關鍵詞和主題集合,分別為主題集合:T={主題t1,主題t2…,主題tn},主題關鍵詞:主題t1:{關鍵詞k11,關鍵詞k12…,關鍵詞k1p},主題t2:{關鍵詞k21,關鍵詞k22…,關鍵詞k2q},…,主題tn:{關鍵詞kn1,關鍵詞kn2…,關鍵詞knm},其中,n為待測網頁中主題的總數,p為主題t1下的主題關鍵詞的總數,q為主題t2下的主題關鍵詞的總數,m為主題tn下的主題關鍵詞的總數。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京郵電大學,未經南京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202010185732.8/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖、流程工藝圖技術構造圖;

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产无套精品一区二区| 亚洲第一天堂无码专区| 久久婷婷国产香蕉| 亚洲福利视频一区| 中文字幕制服丝袜一区二区三区 | 国产色午夜婷婷一区二区三区| 一区二区欧美视频| 性国产日韩欧美一区二区在线| 亚洲精品一区在线| 午夜影院5分钟| 理论片午午伦夜理片在线播放| 日本一区二区在线观看视频| 欧美一区二区三区免费播放视频了| 亚洲国产精品国自产拍久久| 毛片大全免费观看| 国产国产精品久久久久| 午夜精品99| 久久免费精品国产| 最新国产精品自拍| 午夜黄色大片| 91免费看国产| 91超薄丝袜肉丝一区二区| 综合在线一区| 91精品美女| 国产婷婷色一区二区三区在线| 国产一区二区伦理| 热99re久久免费视精品频软件 | 国产精品九九九九九九| 国产91在| 综合在线一区| 激情久久影院| 国产91麻豆视频| 中文字幕久久精品一区| 欧美黄色片一区二区| 国产精品对白刺激久久久| 97欧美精品| 国产一区=区| 日本午夜精品一区二区三区| 17c国产精品一区二区| 91偷自产一区二区三区精品| 久久黄色精品视频| 日韩av在线播放网址| 日本午夜久久| 国产精品v欧美精品v日韩精品v| 色婷婷综合久久久久中文| 精品国产乱码久久久久久久| 波多野结衣巨乳女教师| 国产乱对白刺激视频在线观看| 久久久国产精品一区| 北条麻妃久久99精品| 亚洲区在线| 91亚洲精品国偷拍自产| 欧美精品一区二区三区久久久竹菊| 扒丝袜网www午夜一区二区三区| 99精品一级欧美片免费播放 | 中出乱码av亚洲精品久久天堂| 国产男女乱淫真高清视频免费| 国产乱码一区二区三区| 午夜免费网址| 亚洲精品91久久久久久| 在线观看黄色91| 欧美综合国产精品久久丁香| 夜色av网站| 国产欧美一区二区三区视频| 亚洲精品一区中文字幕| 日韩亚洲精品视频| 99久久精品免费视频| 四虎久久精品国产亚洲av| 国产不卡网站| 91日韩一区二区三区| 国产网站一区二区| 欧美一区二区三区免费视频| 久久久久亚洲最大xxxx| 国产一二三区免费| 一区二区免费在线观看| 免费久久一级欧美特大黄| 久久99国产精品久久99果冻传媒新版本| 国产精品对白刺激久久久| 最新国产一区二区| 国产午夜精品理论片| 国产精品日韩电影| 欧美hdxxxx| 99爱精品在线| 亚洲va国产| 午夜av男人的天堂| 国产影院一区二区| 国产精品日韩精品欧美精品| 欧美日韩一区二区高清| 羞羞免费视频网站| 日韩av中文字幕在线| 国产精品一区二区日韩新区| 午夜一区二区三区在线观看| 91人人爽人人爽人人精88v| 国产精品偷拍| 国产精品久久久久久亚洲美女高潮| 日韩精品中文字幕一区二区| 亚洲精品无吗| 国产精品久久久久久久久久软件| 午夜影院毛片| 欧美日韩国产色综合视频| 国产精品女同一区二区免费站| 偷拍区另类欧美激情日韩91| 欧美日韩中文字幕一区| 国产精品久久久不卡| 国产精品网站一区| 韩国视频一区二区| 亚洲精品国产一区二| 久久99国产综合精品| 国产91视频一区| 国产亚洲另类久久久精品| 国产精品欧美一区乱破| 亚洲精品久久久久一区二区 | 欧美在线播放一区| 国产欧美一二三区| 午夜剧场一区| 欧美午夜精品一区二区三区| 偷拍久久精品视频| 国产精品久久久久久久久久久久冷| 久久99精品国产一区二区三区| 欧美在线视频精品| 国产一二区精品| 欧美乱大交xxxxx古装| 日韩精品一区二区三区不卡| 精品一区二区三区影院| 丝袜脚交一区二区| 国产女人与拘做受免费视频| 国产乱xxxxx国语对白| 日韩av中文字幕在线免费观看 | 日韩毛片一区| 欧美乱妇高清无乱码免费| 日本一二三不卡| 国产一区二区日韩| 欧美日韩一区二区三区不卡| bbbbb女女女女女bbbbb国产| 精品国产一区二区三区四区vr| 欧美日本三级少妇三级久久| 国产一二区精品| 日韩精品中文字幕一区二区三区| 国产极品一区二区三区| 91精品视频免费在线观看| 久久久国产精品一区| 免费xxxx18美国| 国模精品免费看久久久| 在线观看欧美一区二区三区| 国产不卡网站| 鲁一鲁一鲁一鲁一鲁一av| 视频一区二区三区欧美| 91视频国产一区| 久久精品亚洲精品国产欧美| 久久密av| 久久国产这里只有精品| 国产欧美一区二区三区视频| 狠狠色噜噜狠狠狠狠88| 久久亚洲精品国产日韩高潮| 国产1区2| 欧美日韩中文国产一区发布 | 国产精品视频1区2区3区| 国产天堂第一区| 又色又爽又大免费区欧美| 野花社区不卡一卡二| 久久99亚洲精品久久99果| 色婷婷精品久久二区二区6| 国产日本欧美一区二区三区| bbbbb女女女女女bbbbb国产| 大bbw大bbw巨大bbb| 精品国产一级| 国产亚洲精品久久午夜玫瑰园| 91福利视频免费观看| 香港日本韩国三级少妇在线观看| 十八无遮挡| 国产www亚洲а∨天堂| 年轻bbwwbbww高潮| 日韩中文字幕亚洲精品欧美| 免费a级毛片18以上观看精品| 99re热精品视频国产免费| 欧美精品一区二区三区久久久竹菊| 满春阁精品av在线导航 | 日韩av免费电影| 91日韩一区二区三区| 午夜精品999| 国产人伦精品一区二区三区| 国产91电影在线观看| 夜色av网站| 亚洲欧美国产日韩色伦| 午夜伦情电午夜伦情电影 | 亚洲精欧美一区二区精品| 欧美日韩国产在线一区| 欧美髙清性xxxxhdvid| 国产日韩欧美网站| 性色av香蕉一区二区| 国产一级大片| 日本精品一区二区三区视频| 私人影院av| 国产精品亚洲欧美日韩一区在线| 国产在线不卡一区| 日本二区在线观看| 国偷自产中文字幕亚洲手机在线| 国产偷国产偷亚洲清高| 国产日韩欧美不卡| 亚洲精品国产一区二区三区| 免费超级乱淫视频播放| 亚洲欧美制服丝腿| bbbbb女女女女女bbbbb国产| 国产精品乱码一区二区三区四川人| 91精品国产综合久久婷婷香| 一区二区三区在线影院| 99精品久久久久久久婷婷| 日韩精品免费一区二区夜夜嗨| 国产在线一二区| 李采潭无删减版大尺度| free性欧美hd另类丰满| 国产色婷婷精品综合在线播放| 国产精品v欧美精品v日韩| 国产欧美一二三区| 国产精品亚洲一区二区三区| 中文字幕一区三区| 亚洲天堂国产精品| 99精品小视频| 日韩国产精品久久| 欧美乱妇在线视频播放| 亚洲精品日韩在线| 国产一区在线视频观看| 日本高清h色视频在线观看| 国产人澡人澡澡澡人碰视| 国精产品一二四区在线看| 国产精品久久久久久久久久久新郎 | 欧美一区二区激情三区| 亚洲精品国产一区| 日本大码bbw肉感高潮| 午夜精品999| 欧美精品国产一区二区| 午夜免费片| 少妇太爽了在线观看免费| 精品国产鲁一鲁一区二区作者 | 视频一区欧美| 国产欧美一区二区三区免费视频| 久久99国产精品久久99| 男女无遮挡xx00动态图120秒| 国产精品视频久久久久| 亚洲精品乱码久久久久久麻豆不卡| 国产三级国产精品国产专区50| 91av中文字幕| 国产九九影院| 久久99精品国产一区二区三区| 久久久人成影片免费观看| 精品久久久久一区二区|