日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種基于壓縮感知理論的文本數據流抽樣方法有效

專利信息
申請號: 201510024381.1 申請日: 2015-01-16
公開(公告)號: CN104504156B 公開(公告)日: 2017-07-11
發明(設計)人: 彭敏 申請(專利權)人: 武漢大學
主分類號: G06F17/30 分類號: G06F17/30
代理公司: 武漢科皓知識產權代理事務所(特殊普通合伙)42222 代理人: 薛玲
地址: 430072 湖*** 國省代碼: 湖北;42
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 基于 壓縮 感知 理論 文本 數據流 抽樣 方法
【說明書】:

技術領域

發明屬于互聯網大數據文本檢索領域,涉及一種文本壓縮和抽樣技術,具體涉及一種基于壓縮感知理論的大規模文本數據流抽樣方法。

背景技術

隨著社交媒體的發展,越來越多的人喜歡分享最新的新聞熱點問題或對產品進行評論。這些諸如Twitter、Facebook、Blogger和亞馬遜等社交媒體或者電商網站的用戶產生的內容(UGC)形成了大規模的文本數據流。例如,超過80%的新浪微博用戶參與2014巴西世界杯的話題討論、超過76%的用戶在他們觀看比賽直播時發布微博。截至2011年1月,在YouTube上搜索奧巴馬就職典禮就有超過30000個視頻。2010年在YouTube上U2演唱會的直播在Twitter上產生了超過130000的帖子。UGC能夠以數據流的形式被連續收集,并且在各個領域也有廣泛的應用,如科學研究、系統管理、客戶調查、輿情分析等等。這些應用通??梢猿橄蟪筛黝愐晕谋緸楹诵牡男畔⑼诰蛉蝿眨绮粩嗝嫦騎witter文本流,可以挖掘高質量的文本集或重要頻繁模式,以及檢測大規模數據流出現的新文檔或新主題。

然而,使用UGC文本流做挖掘任務存在兩個重要的挑戰:1)如何管理和儲存大量動態文本流,使之更有效的計算?2)在以文本為中心的挖掘任務中,例如主題探測或用戶興趣分析,是否需要使用的所有文本流?也就是說,是否所有的文本流在挖掘任務同等重要?

事實上,在信息檢索或新主題探測等以文本為中心的挖掘任務中,一方面,對于一個給定的計算量,減少其所需的機器或者磁盤數量可以節省計算資源消耗的成本。此外,減少數據規模能夠讓更多的數據存儲在內存中,從而提高計算效率;另一方面,UGC文本通常與各種現實世界的事件相關,對于特定分析目標,這些UGC文本中的一些可能包含有趣和有用的信息,而另一些則價值很小。根據研究,近36%的tweets值得一讀,其余tweets的可讀性一般甚至較差。也就是說,不同文本的內容質量有很大的不同,因此,從大規模文本流中識別出高質量的文本流,對于提高以文本為核心的挖掘任務的準確性和效率至關重要。此外,從時序分析來看,歷史數據通常比新到達的數據價值小。因此,根據文本內容的質量和新鮮度對文本加以區分至關重要,一般將內容質量高和新鮮度高的文本稱為有價值的文本。

社交媒體和電子商務的普及使得在線用戶原創內容文本UGC,如微博、博客和產品評論等,持續和快速地增長。這些大規模文本具有海量、暫時有序、快速變化和潛在無限的特點。如何使用更少的內存消耗、更快的計算時間,來處理不斷增加的文本流,是互聯網大數據文本檢索領域的迫切需要解決的問題。

發明內容

為了解決上述的技術問題,本發明面向互聯網海量的、不斷增加的文本流,提出了一種基于壓縮感知理論的文本數據流抽樣方法,通過更少的存儲消耗來實現更快的文本流抽樣和存儲,在大大降低抽樣文本流規模的情況下,確保能夠以全局視角獲得整個文本流中最有價值的那部分信息。

本發明所采用的技術方案是:一種基于壓縮感知理論的文本數據流抽樣方法,其特征在于,包括以下步驟:

步驟1:將文本數據流分割成固定大小的文本片段并通過向量空間模型表示成矩陣;

步驟2:使用壓縮感知理論對文本數據流進行空間降維抽樣;

步驟3:計算降維后每個文本的信息熵;

步驟4:基于文本的信息熵通過對數傾斜時間(LTT)模型壓縮存儲抽樣文本。

作為優選,步驟1中所述的固定大小的文本片段由TF或TF-IDF模型表示成矩陣其中P表示固定大小文本片段中文本的數量,n為向量空間的維數,L是當前文本數據流片段的數量。

作為優選,步驟2的具體實現過程是,對于給定的文本片段使用高斯隨機矩陣作為測量矩陣Ф,使用壓縮理論中的公式對Xl進行投影得到測量值實現空間降維,其中m≤n,計算如公式1所示:

Yl=ΦXl(公式1)。

作為優選,步驟3的具體實現過程是,對于降維后每個文本,第l個文本片段中的第i個文本的內容質量由信息熵E(i,l)來衡量,其計算如公式2所示:

E(i,l)=-Σp(tj,l)logp(tj,l)(公式2);

其中p(tj,l)是第i個文本中第j項在第l個片段中出現的頻率,tj,l∈Yii。

作為優選,步驟4的具體實現包括以下子步驟:

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢大學,未經武漢大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201510024381.1/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖、流程工藝圖技術構造圖;

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产精品一区在线观看你懂的 | 欧美乱偷一区二区三区在线| 国内精品久久久久久久星辰影视 | 欧美性xxxxx极品少妇| 日韩av在线中文| 一区二区久久精品| 精品福利一区二区| 亚洲日韩欧美综合| 精品国产免费久久| 色婷婷噜噜久久国产精品12p| 国产一区二区高清视频 | 国产的欧美一区二区三区| 久久婷婷国产香蕉| 国产精品久久国产三级国电话系列| 欧美色综合天天久久综合精品| 7799国产精品久久99| 国产精品二区一区二区aⅴ| 4399午夜理伦免费播放大全| 91精品系列| 一区精品二区国产| 97人人模人人爽人人喊38tv| 国产精品一区在线观看你懂的| 国产一区在线免费| 久久精品国产亚洲7777 | 欧美乱大交xxxxx古装| 日本高清h色视频在线观看| **毛片免费| 91九色精品| 99精品少妇| 久久国产精品网站| 国产一区二区三区四区五区七| 日韩电影在线一区二区三区| 国产又色又爽无遮挡免费动态图| 99精品黄色| 国产乱人伦偷精品视频免下载| free性欧美hd另类丰满| 91麻豆精品国产91久久久更新时间| 欧美视频1区| 久久99精品久久久秒播| 蜜臀久久99精品久久久久久网站| 欧美在线一区二区视频| 精品福利一区| 亚洲精品国产一区二| 日韩av在线高清| 国产午夜精品一区二区三区最新电影 | 日韩欧美中文字幕一区| 久久九九国产精品| 亚洲欧美日韩国产综合精品二区 | 亚洲va欧美va国产综合先锋| 国产精品国产一区二区三区四区| 欧美日韩激情一区| 99国产精品一区二区| 日韩欧美一区二区在线视频| 国产精品综合一区二区三区| 欧美一区二区三区四区五区六区| 国产一区二区三区四| 欧美日韩一区二区三区不卡视频| 日本一二三区视频| 国产视频一区二区视频| 99国产精品丝袜久久久久久| 欧美福利三区| 久久五月精品| 首页亚洲欧美制服丝腿 | 精品中文久久| 中文在线√天堂| 亚洲欧洲日韩av| 狠狠色噜狠狠狠狠| 色吊丝av中文字幕| 欧美一区二区三区精品免费| 岛国黄色网址| 国产精品国产一区二区三区四区 | 国产69久久| 欧美乱妇在线视频播放| 国产精品一卡二卡在线观看| 国产一区2| 欧美乱妇在线观看| 久久国产激情视频| 国产精品不卡一区二区三区| 亚洲少妇一区二区| 国产精品天堂网| 国产色婷婷精品综合在线播放| 日日夜夜精品免费看| 国产精品久久久区三区天天噜| 欧美日韩国产在线一区| 日本午夜精品一区二区三区| 销魂美女一区二区| 日本三级韩国三级国产三级| 四虎国产精品久久| 亚洲精品中文字幕乱码三区91| 亚洲精品国产精品国自产网站按摩| 国产午夜三级一区二区三| 欧美日韩偷拍一区| 精品一区欧美| 国产无遮挡又黄又爽又色视频| 亚洲免费永久精品国产| 国产精品白浆视频| av午夜在线观看| 欧美一区二区三区白人| 久久不卡精品| 亚洲精品456| 欧美精选一区二区三区| 国产精选一区二区| 日韩精品中文字幕一区二区| 91精品国产影片一区二区三区| 国产精品二十区| 思思久久96热在精品国产| 97人人澡人人爽人人模亚洲 | 99视频国产在线| xxxx国产一二三区xxxx| 狠狠插狠狠干| 亚洲精品91久久久久久| 99re6国产露脸精品视频网站| 欧美日韩中文不卡| 91麻豆精品国产综合久久久久久| 精品国产区一区二| 欧美日韩中文字幕三区| 日日夜夜一区二区| 国产偷国产偷亚洲清高| 黄毛片在线观看| 日韩精品一二区| 欧美激情精品一区| 麻豆国产一区二区| 91亚洲精品国偷拍自产| 四虎久久精品国产亚洲av| 国产日韩一区二区在线| 国产欧美一区二区精品性色超碰| 久久99精品国产麻豆婷婷洗澡| 国产综合亚洲精品| 国产精品一区不卡| 久久99精品久久久野外直播内容| 日韩一区二区精品| 欧美精品一区二区三区四区在线| 欧美日韩国产在线一区| 亚洲一二三四区| 国产精品自拍在线观看| 日韩亚洲精品在线| 国产品久精国精产拍| 国产精品乱战久久久| 欧美日韩国产免费观看| 国产伦理精品一区二区三区观看体验| 午夜特片网| 欧美日韩亚洲另类| 国产精品美乳在线观看 | 日韩欧美中文字幕精品| 久久九九亚洲| 香港三日三级少妇三级99| 激情久久久久久| 午夜影院试看五分钟| 国产欧美一区二区三区不卡高清| 欧美激情在线一区二区三区| 国产精品一区二区av麻豆| 国产免费一区二区三区网站免费 | 国产精品96久久久| 久久久久久久国产| 精品国产伦一区二区三区免费| 高清欧美精品xxxxx在线看| 日本边做饭边被躁bd在线看| 国产精品天堂网| 综合久久色| 国产日产精品一区二区三区| 精品国产一区在线| 国产的欧美一区二区三区| 国产香蕉97碰碰久久人人| 日本午夜影视| 亚洲精品久久久久一区二区| 99国产精品久久久久99打野战 | 2023国产精品久久久精品双| 久久人人爽爽| 国产一区二区三区国产| 少妇高潮在线观看| 最新国产精品自拍| 性色av色香蕉一区二区| av午夜影院| 国产资源一区二区| 久久久久久国产精品免费| 久久国产精品欧美| 欧美一级免费在线视频| 午夜看片网| 91精品免费观看| 欧美日韩一区二区三区不卡| 国产清纯白嫩初高生在线观看性色| 亚洲午夜天堂吃瓜在线| 日韩精品一区二区三区免费观看视频| 欧美精品中文字幕亚洲专区| 国产一区二区资源| 亚日韩精品| 国产剧情在线观看一区二区| 999久久久国产精品| 欧美性xxxxx极品少妇| 91久久免费| 亚洲va久久久噜噜噜久久0| 国产精品一区亚洲二区日本三区 | 精品99在线视频| 国产免费一区二区三区四区五区| 99国产精品99久久久久久粉嫩| 亚洲国产精品网站| 高清人人天天夜夜曰狠狠狠狠 | 欧美日韩一区二区三区不卡| 国产v亚洲v日韩v欧美v片| 日本aⅴ精品一区二区三区日| 少妇久久精品一区二区夜夜嗨 | 久久国产欧美一区二区三区精品| 国久久久久久| 欧美三级午夜理伦三级老人| 日韩精品一区二区三区不卡| 午夜无遮挡| 97人人模人人爽视频一区二区| 国产精品亚洲欧美日韩一区在线| 欧美国产一二三区| 精品国精品国产自在久不卡| 日韩一级片免费观看| 中文字幕+乱码+中文字幕一区| 亚洲第一区国产精品| 日本一区二区电影在线观看| 免费高潮又黄又色又爽视频| 国产欧美日韩在线观看| 午夜影院你懂的| 中文字幕制服狠久久日韩二区 | 国产欧美一区二区三区四区| 国产一区二区视频在线| 国产欧美精品久久| 亚洲欧美视频一区二区| 在线视频不卡一区| 少妇特黄v一区二区三区图片| 欧美日韩三区二区| 十八无遮挡| 午夜免费av电影| 中文字幕一区二区三区日韩精品| 国产乱一区二区三区视频| 国产精品v亚洲精品v日韩精品| 99久久精品免费视频| 国产一卡二卡在线播放| 亚洲四区在线观看| 性欧美精品动漫| 欧美日韩偷拍一区| 午夜国内精品a一区二区桃色| 精品国产乱码一区二区三区在线| 国产精品一二三区免费| 日本一级中文字幕久久久久久| 久久综合伊人77777麻豆| 久久久久国产精品一区二区三区| 91国偷自产一区二区介绍| 国产精品久久久久久久妇女| 午夜看片在线| 日韩av不卡一区二区| 69xx国产|