日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]大型語料庫上的快速文本聚類方法有效

專利信息
申請號: 201711290927.3 申請日: 2017-12-08
公開(公告)號: CN108228721B 公開(公告)日: 2021-06-04
發明(設計)人: 李林蔚;郭良琛;馬會心;何震瀛;荊一楠;王曉陽 申請(專利權)人: 復旦大學
主分類號: G06F16/28 分類號: G06F16/28;G06F16/35
代理公司: 上海正旦專利代理有限公司 31200 代理人: 陸飛;陸尤
地址: 200433 *** 國省代碼: 上海;31
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 大型 語料庫 快速 文本 方法
【權利要求書】:

1.一種大型語料庫上的快速文本聚類的方法,其特征在于,具體步驟如下:

(1)給定由大量文檔組成的文本數據集D,首先為后續的連乘計算構建索引;

在索引中,第i個元素ai的值為建立了這樣一類索引后,的值通過單次除法完成

(2)由用戶給出超參數α,β以及聚類過程中的總分類數K,使用基于吉布斯采樣的狄利克雷多項混合模型,對每個文檔所屬的類別編號進行推斷,具體過程為:

(2.1)對于語料庫中的任一文檔為其隨機分配一個類別編號zi

(2.2)對于所有文檔進行遍歷,并且根據語料庫中其它文檔的當前分類情況,根據狄利克雷后驗分布公式,采樣更新文檔i所屬的類別,其服從的分布為:

分布公式經簡化后的結果如下:

(2.3)針對需要采樣的分布p(x),選取更易采樣且滿足如下性質的提案分布q(x):若對于第i步以q(xi|xi-1)的轉移概率構建的馬爾可夫鏈,其轉移足夠多步之后各狀態的概率分布收斂于p(x);

(2.4)采樣獲得初始樣本x0~q(x);

(2.5)采樣獲得xcand~q(xcand|xi-1),計算接受概率為:

并以上述概率接受這個采樣結果,即令xi為xcand,不接受,則令xi為xi-1

(2.6)重復步驟(2.5)至指定次數;

(2.7)返回當前的xi作為采樣結果;

(2.8)重復步驟(2.2-2.7),直至收斂;

(2.9)以每一文檔被分配的類別編號作為標準給出聚類結果;

公式中所用的符號及含義如下:

M表示語料庫中的文檔數目;

T表示詞匯中不同單詞的數目;

K表示聚類數目;

α,β表示狄利克雷分布的先驗參數;

表示第i篇文檔;

zi表示第i篇文檔的聚類編號;

nkt表示第k個聚類中單詞t的出現次數;

nk表示第k個聚類中單詞的總個數;

Nit表示第i個文檔中單詞t的出現次數;

Ni表示第i個文檔中單詞的總個數;

mk表示第k個聚類中文檔個數;

表示第k個聚類中的詞匯分布;

θ表示語料庫中所有聚類的分布。

2.根據權利要求1所述的方法,其特征在于,在采樣過程中,對于形式為的計算,若在兩輪迭代間只有少量f(nkw)的值發生變化,則僅針對nkw值發生變化的w進行計算。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于復旦大學,未經復旦大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201711290927.3/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 午夜av免费观看| 性精品18videosex欧美| 国产日韩欧美另类| 996久久国产精品线观看| 人人澡超碰碰97碰碰碰| 欧美三区视频| 国产精品网站一区| 国产精品久久久综合久尹人久久9| 午夜亚洲影院| 性欧美激情日韩精品七区| 亚洲精品乱码久久久久久国产主播| 人人要人人澡人人爽人人dvd| 欧美大片一区二区三区| 国产亚洲欧美日韩电影网| 中文字幕欧美一区二区三区 | 中文字幕一区二区三区乱码| 国产精品久久国产三级国电话系列 | 亚洲自拍偷拍中文字幕| 欧美在线视频一二三区| 李采潭伦理bd播放| 99久热精品| 少妇特黄v一区二区三区图片| 午夜叫声理论片人人影院| 欧美一级久久久| 一区二区三区在线影院| 精品a在线| 韩国女主播一区二区| 狠狠色丁香久久综合频道| 久久久久久久久久国产精品| 国产精品乱码一区| 久久91精品国产91久久久| 麻豆91在线| 69久久夜色精品国产69–| 日韩中文字幕一区二区在线视频| 亚洲欧美国产日韩综合| 91麻豆精品国产91久久久资源速度| 8x8x国产一区二区三区精品推荐 | 国产欧美一区二区在线观看| 国产精品久久国产三级国电话系列| 久久久999精品视频| 亚洲无人区码一码二码三码| 国产欧美日韩精品一区二区三区 | 日韩区欧美久久久无人区| 狠狠色依依成人婷婷九月| 日韩国产不卡| 91精品资源| 国产午夜精品一区| 国产精品v亚洲精品v日韩精品| 久精品国产| 久爱精品视频在线播放| xxxxx色| 国产欧美一区二区三区视频| 国产一区二区电影| 岛国黄色网址| 国产精品1234区| 午夜看片网址| 97国产精品久久| 国产精品1区2区| 2023国产精品久久久精品双| 在线精品国产一区二区三区| 精品国产乱码久久久久久图片| 久久午夜鲁丝片| 日韩欧美多p乱免费视频| 美女被羞羞网站视频软件| 久久一二区| 97欧美精品| 亚洲欧美精品suv| 久久国产精品免费视频| 色狠狠色狠狠综合| 国产影院一区二区| 久久国产免费视频| 亚洲欧洲一区二区| 大bbw大bbw巨大bbw看看| 国产在线观看免费麻豆| 国产亚洲综合一区二区| 久久久国产精品一区| 亚洲欧美另类综合| 浪潮av色| 国产亚洲精品久久19p| 精品国产乱码久久久久久图片| 精品一区二区三区中文字幕| 亚洲精品20p|