日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]基于PLSA算法判斷文檔相關性的方法及裝置有效

專利信息
申請?zhí)枺?/td> 201310684227.8 申請日: 2013-12-13
公開(公告)號: CN103678599B 公開(公告)日: 2016-10-26
發(fā)明(設計)人: 何銳邦;唐會軍 申請(專利權)人: 北京奇虎科技有限公司;奇智軟件(北京)有限公司
主分類號: G06F17/30 分類號: G06F17/30
代理公司: 北京市浩天知識產權代理事務所(普通合伙) 11276 代理人: 宋菲;劉蘭蘭
地址: 100088 北京市西城區(qū)新*** 國省代碼: 北京;11
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 基于 plsa 算法 判斷 文檔 相關性 方法 裝置
【說明書】:

技術領域

發(fā)明涉及網絡通信技術領域,具體涉及一種基于PLSA算法判斷文檔相關性的方法及裝置。

背景技術

目前,在判斷兩個文檔的相關性時所采用的傳統(tǒng)方法是通過查看兩個文檔共同出現的詞匯的多少進行判斷,例如可以采用TF-IDF(term?frequency–inverse?document?frequency)等算法來判斷。但是,這種方法只是采用簡單的詞匯匹配方式進行判斷,并沒有考慮到文字背后的語義關聯,有時,可能在兩個文檔中共同出現的詞匯很少甚至沒有,但由于這兩個文檔的語義相關,導致這兩個文檔實質上是相似的。因此,為了提高判斷結果的準確率,在判斷文檔相關性的時候還需要考慮詞匯的語義關聯問題。通常,采用主題模型來進行語義挖掘,進而判斷語義是否相關。常用的主題模型算法為PLSA(Probabilistic?Latent?Semantic?Analysis,概率潛在語義分析)算法。

PLSA算法屬于模糊聚類算法,其目的在于從文本中發(fā)現隱含的主題,具有處理一詞多義和一義多詞的能力。通過PLSA算法進行計算時,需要用到兩個初始矩陣,第一個初始矩陣表示文檔與主題之間的對應關系,第二個初始矩陣表示詞匯與主題之間的對應關系。具體地,先要對這兩個初始矩陣進行初始化,然后,在后續(xù)的計算過程中,不斷地根據輸入數據,一輪一輪地進行迭代,從而對這兩個初始矩陣進行修正,直到計算結果收斂(即符合輸入數據的真實概率分布)為止。

目前,在對上述的兩個初始矩陣進行初始化時,通常假設每篇文檔都以相同的概率屬于各個主題,即:如果指定了共有T個主題,則每篇文檔在每個主題下的概率均為1/T,因此,第一個初始矩陣中各個矩陣數據的初始值均為1/T。同理,假設每個詞都會出現在每個主題中,并且出現的概率相同,即:如果共有W個詞,則每個主題下,每個詞的出現概率均為1/W,因此,第二個初始矩陣中各個矩陣數據的初始值均為1/W。采用上述初始化方式時,由于每個初始矩陣的各個數據所表示的概率都是相同的,而這往往與實際情況相去甚遠,所以,在后續(xù)的迭代過程中往往需要迭代計算較多的輪數(通常情況下超過200輪),才能使計算結果收斂。所以計算耗時非常長,數據量大的情況下往往需要一整天的時間。

發(fā)明內容

鑒于上述問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決上述問題的基于PLSA算法判斷文檔相關性的方法及裝置。

依據本發(fā)明的一個方面,提供了一種基于PLSA算法判斷文檔相關性的方法,包括:根據文檔信息確定待處理的元素以及元素對應的分類;將元素的個數N確定為PLSA算法中所需的計算矩陣的列數,將分類的個數M確定為計算矩陣的行數,其中,計算矩陣中的矩陣數據表示元素與分類之間的對應關系,N和M均為自然數;通過硬聚類算法將N個待處理的元素匯聚為M個分類,得到每個元素在各個分類下的隸屬度取值;根據每個元素在各個分類下的隸屬度取值,對計算矩陣中的矩陣數據進行初始化,并根據PLSA算法對初始化之后的矩陣數據進行迭代運算,根據運算結果判斷文檔是否相關。

可選地,文檔信息包括:文檔標號以及文檔所屬的主題,則待處理的元素為文檔標號,分類為文檔所屬的主題,則計算矩陣中的矩陣數據表示文檔標號與主題之間的對應關系。

可選地,文檔信息包括:文檔所屬的主題以及文檔中的詞匯,則待處理的元素為文檔中的詞匯,分類為文檔所屬的主題,計算矩陣中的矩陣數據表示詞匯與主題之間的對應關系。

可選地,硬聚類算法為MinHash算法或SimHash算法。

可選地,每個元素在各個分類下的隸屬度取值為0或1,則根據每個元素在各個分類下的隸屬度取值,對計算矩陣中的矩陣數據進行初始化的步驟具體包括:當一個元素在指定分類下的隸屬度取值為0時,將計算矩陣中相應的矩陣數據初始化為0;當一個元素在指定分類下的隸屬度取值為1時,將計算矩陣中相應的矩陣數據初始化為1;進一步判斷每一行的矩陣數據之和是否大于1,并在大于1時對該行數據進行歸一化,使該行數據之和等于1。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京奇虎科技有限公司;奇智軟件(北京)有限公司,未經北京奇虎科技有限公司;奇智軟件(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201310684227.8/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發(fā)明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業(yè)標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产精品乱码久久久久久久| 日韩区欧美久久久无人区| 午夜老司机电影| 浪潮av网站| 久久久国产精品一区| 99视频一区| 欧美日韩中文不卡| 国产精品爽到爆呻吟高潮不挺| 国产99久久九九精品免费| 欧美高清性xxxxhdvideos| 国产无遮挡又黄又爽免费网站| 国产免费一区二区三区网站免费| 国产精品一区二区三区在线看| 国产91福利视频| 欧美一区久久| 性old老妇做受| 激情久久精品| 男女视频一区二区三区| 毛片免费看看| 久久婷婷国产麻豆91天堂徐州| 国产精品久久91| 99热久久这里只精品国产www| 国产69精品久久久久男男系列| 欧美一区二区三区在线视频观看| 国产一区免费播放| 夜色av网| 国产一区二区电影| 91精品啪在线观看国产| 国产精品入口麻豆九色| 中文字幕一区一区三区| 欧美三级午夜理伦三级老人| 狠狠色综合久久丁香婷婷| 国产午夜精品一区二区三区欧美| 久久夜色精品久久噜噜亚| 欧美日韩精品在线播放| 午夜影院一区| 久久国产欧美日韩精品| 亚洲精品www久久久久久广东| 国产精品偷乱一区二区三区| 国产精品第56页| 国产乱一区二区三区视频| 亚洲精品国产一区二| 国产高清在线精品一区二区三区| aaaaa国产欧美一区二区| 国产一区二区电影| 88888888国产一区二区| xx性欧美hd| 欧美性xxxxx极品少妇| 午夜伦全在线观看| 国内精品99| 蜜臀久久久久久999| 亚洲欧洲精品一区二区三区不卡| 激情久久久| 8x8x国产一区二区三区精品推荐| 午夜激情在线免费观看| 亚洲乱视频| 视频国产一区二区| 扒丝袜pisiwa久久久久| 国产精品视频二区不卡| 国产在线卡一卡二| 国产影院一区二区| 国产三级在线视频一区二区三区| 精品国产1区2区3区| 少妇bbwbbwbbw高潮| 处破大全欧美破苞二十三| 91久久一区二区| 国产精品久久国产三级国电话系列| 99爱国产精品| 国产二区视频在线播放| 国产区二区| 午夜电影一区二区三区| 午夜av在线电影| 日本中文字幕一区| 97人人澡人人爽人人模亚洲| 午夜av影视| 欧美一区二区综合| 91人人爽人人爽人人精88v| 国产欧美日韩二区| 日本高清二区| 欧美精品一区二区三区视频| 岛国黄色av| 亚洲欧美一卡| 四虎国产永久在线精品| 亚洲精品日本无v一区| 国产一区二区三区小说| 亚洲欧美一卡| 国产欧美一区二区三区免费看| 91超薄丝袜肉丝一区二区| 一区二区三区毛片| 97久久超碰国产精品| 国产在线一卡| 久久国产欧美一区二区免费| 国产一a在一片一级在一片| 中文字幕亚洲欧美日韩在线不卡| 国产色婷婷精品综合在线播放| 午夜av免费观看| 首页亚洲欧美制服丝腿| 精品久久久久久亚洲综合网| av午夜剧场| 性刺激久久久久久久久九色| 国产网站一区二区| 久久久综合亚洲91久久98| 思思久久96热在精品国产| 国产专区一区二区| 黄色av免费| 麻豆精品久久久| 久久人91精品久久久久久不卡| 色就是色欧美亚洲| 精品久久国产视频| 国产在线干| 亚洲va国产2019| 毛片免费看看| 国产精品久久久久久久久久久新郎| 国产精品久久久久免费a∨大胸| yy6080影院旧里番乳色吐息| 天干天干天啪啪夜爽爽99| yy6080影院旧里番乳色吐息| 久久精品男人的天堂| 国产精品综合在线观看| 高清国产一区二区| 国产精品亚发布| free性欧美hd另类丰满| 农村妇女精品一二区| 黄毛片在线观看| 欧美一区免费| 午夜影院啪啪| 国产一区二区高清视频| 午夜毛片在线| 久久夜色精品久久噜噜亚| www.午夜av| 国产精品自产拍在线观看蜜| 日韩欧美视频一区二区| 中文字幕亚洲欧美日韩在线不卡| 国产超碰人人模人人爽人人添| 亚洲精品国产久| 国产精品无码永久免费888 | 国产天堂第一区| 久久国产精品-国产精品| 亚洲精品国产一区二区三区| 日韩欧美中文字幕一区| 国产一区精品在线观看| 国产电影精品一区二区三区| 欧美一区二区三区四区夜夜大片| av中文字幕一区二区| 国产伦理精品一区二区三区观看体验 | 国产一区三区四区| 亚洲欧洲日韩在线| 亚洲福利视频二区| 香蕉视频一区二区三区| 亚洲精品少妇久久久久| 久久久综合亚洲91久久98| 午夜影院伦理片| 亚洲少妇一区二区| 26uuu色噜噜精品一区二区 | 精品国产一区二区三区麻豆免费观看完整版| 一级午夜影院| 国产欧美综合一区| 在线国产91| 色天天综合久久久久综合片| 国产精品1区二区| 91av中文字幕| 午夜剧场a级片| 91精品国产综合久久婷婷香| 国产精品视频二区不卡| 97人人澡人人爽91综合色| 日韩欧美一区精品| 欧美日韩一区二区三区在线播放 | 大bbw大bbw巨大bbb| 中文字幕一级二级三级| 国产精品久久久爽爽爽麻豆色哟哟 | 99热久久这里只精品国产www| 亚洲女人av久久天堂| 国产日韩麻豆| 日韩av免费电影| 综合久久国产九一剧情麻豆| 欧美在线一级va免费观看| 欧美日韩一区二区三区在线观看视频 | 久久精品国产色蜜蜜麻豆| 久久99精品一区二区三区| 国产1区2区视频| 国产二区三区视频| 99国产伦精品一区二区三区| 国产清纯白嫩初高生在线播放性色| 久久久一区二区精品| 国产黄色网址大全| 天干天干天干夜夜爽av| 国语精品一区| 99精品视频一区| 久久一区二区精品| 综合久久色| 又色又爽又大免费区欧美| 性old老妇做受| 国产日韩欧美亚洲| 国产精品一区在线观看你懂的 | 日本精品一区二区三区在线观看视频| 97人人模人人爽人人喊38tv| 日韩亚洲精品在线观看| 国产无遮挡又黄又爽免费网站| 国产91免费在线| 国产午夜精品理论片| 国产精品一二三在线观看| 国产欧美www| 亚洲网站久久| 久久综合伊人77777麻豆| 精品久久综合1区2区3区激情| 国产欧美一区二区三区免费视频| 国产欧美日韩一级大片| 亚洲欧美另类国产| 天堂av色婷婷一区二区三区| 欧美乱妇在线视频播放| 国模少妇一区二区三区| 国产在线一区二区视频| 午夜激情免费电影| 日本午夜精品一区二区三区| 国产一区在线视频播放| 国产偷久久一区精品69| 久久er精品视频| 国产视频二区| 狠狠色丁香久久婷婷综合丁香| 久久精品国产99| 精品一区欧美| 亚洲欧美日本一区二区三区 | 久久国产精品欧美| 色婷婷噜噜久久国产精品12p| 国产综合亚洲精品| 99精品视频一区二区| 精品一区二区超碰久久久| 午夜电影院理论片做爰| 欧美hdxxxx| 一区二区在线视频免费观看| 国产特级淫片免费看| 国产精品视频一区二区二| 欧美久久久一区二区三区| 又色又爽又大免费区欧美| 91福利视频免费观看| 亚洲精品久久久久一区二区| 日韩av在线网址| 国产一区二区视频免费在线观看 | 精品国精品国产自在久不卡| 天天干狠狠插| 狠狠插狠狠插| 999久久久国产精品| 欧美日韩中文字幕一区二区三区 | 国产一区二区播放| 岛国黄色网址| 国产91高清|