日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種文本去重方法和裝置有效

專利信息
申請號: 201710225086.1 申請日: 2017-04-07
公開(公告)號: CN107025218B 公開(公告)日: 2021-03-02
發明(設計)人: 許維;鐘黎;王勵;劉黎春 申請(專利權)人: 騰訊科技(深圳)有限公司
主分類號: G06F40/289 分類號: G06F40/289;G06F40/30;G06F16/31
代理公司: 深圳翼盛智成知識產權事務所(普通合伙) 44300 代理人: 黃威
地址: 518000 廣東省深圳*** 國省代碼: 廣東;44
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 文本 方法 裝置
【說明書】:

發明實施例公開了一種文本去重方法和裝置;本發明實施例采用獲取文本集合,該文本集合包括多個待去重文本,然后,針對每個待去重文本,從待去重文本中截取相應的子文本串,在該文本集合中確定具有相同子文本串的待去重文本,得到每種子文本串對應的子文本集合,分別對每種子文本串對應的子文本集合進行文本去重處理,得到每種子文本串對應的去重后文本集合,根據每種子文本串對應的去重后文本集合,獲取該文本集合去重后的結果文本集合;該方案可以極大地降低去重過程中需要兩兩比較的文本數量,降低文本去重的時間復雜度,從而提高文本去重效率。

技術領域

本發明涉及計算機技術領域,具體涉及一種文本去重方法和裝置。

背景技術

目前,在互聯網中充斥著海量的文本,并且包含有大量的重復文本內容。如果在互聯網中存在大量的重復文本,那么一方面降低了整體的文本質量,另一方面會浪費大量的存儲資源。

為了節省存儲資源,需要去除互聯網中重復的文本內容。目前的文本去重方式為:將多個待去重文本進行兩兩比較,基于比較結果將重復的文本去除。然而,目前文本去重方式在由于需要將待重文本兩兩進行比較,在面對海量待去重文本時,會花費大量時間。因此,目前的文本去重方式的時間復雜度較高,會導致文本去重效率比較低。

發明內容

本發明實施例提供一種文本去重方法和裝置,可以提高文本去重效率。

本發明實施例提供一種文本去重方法,包括:

獲取文本集合,所述文本集合包括多個待去重文本;

針對每個待去重文本,從待去重文本中截取相應的子文本串;

在所述文本集合中確定具有相同子文本串的待去重文本,得到每種子文本串對應的子文本集合;

分別對每種子文本串對應的子文本集合進行文本去重處理,得到每種子文本串對應的去重后文本集合;

根據每種子文本串對應的去重后文本集合,獲取所述文本集合去重后的結果文本集合。

相應的,本發明實施例還提供一種文本去重裝置,包括:

文本獲取單元,用于獲取文本集合,所述文本集合包括多個待去重文本;

截取單元,用于針對每個待去重文本,從待去重文本中截取相應的子文本串;

確定單元,用于在所述文本集合中確定具有相同子文本串的待去重文本,得到每種子文本串對應的子文本集合;

去重單元,用于分別對每種子文本串對應的子文本集合進行文本去重處理,得到每種子文本串對應的去重后文本集合;

結果獲取單元,用于根據每種子文本串對應的去重后文本集合,獲取所述文本集合去重后的結果文本集合。

本發明實施例采用獲取文本集合,該文本集合包括多個待去重文本,然后,針對每個待去重文本,從待去重文本中截取相應的子文本串,在該文本集合中確定具有相同子文本串的待去重文本,得到每種子文本串對應的子文本集合,分別對每種子文本串對應的子文本集合進行文本去重處理,得到每種子文本串對應的去重后文本集合,根據每種子文本串對應的去重后文本集合,獲取該文本集合去重后的結果文本集合。該方案可以通過對具有相同子文本串的子文本集合進行文本去重處理,從而實現對整個文本集合的文本去重處理;其無需對整個文本集合中的文本進行兩兩比較去重,并可以將在全局上進行文本兩兩比較去重變為只需對同一子文本串下的文本進行去重,因此,可以極大地降低了去重過程中需要兩兩比較的文本數量,降低文本去重的時間復雜度,提高文本去重效率。

附圖說明

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201710225086.1/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 精品视频在线一区二区三区| 少妇厨房与子伦在线观看| 中文乱码字幕永久永久电影| 午夜av免费看| 精品国产乱码久久久久久老虎| 4399午夜理伦免费播放大全| 亚洲精品国产久| 国产亚洲精品久久久久久久久动漫| 扒丝袜网www午夜一区二区三区| 久久一区二| 国产91视频一区二区| 狠狠色噜噜狠狠狠狠| 91麻豆精品国产91久久久久| 99国产精品久久久久99打野战| 国产vsv精品一区二区62| 岛国黄色av| 亚洲自拍偷拍一区二区三区| 综合久久色| 欧美国产在线看| 欧美日韩国产在线一区二区三区 | 国产中文字幕一区二区三区| 91精品国产综合久久福利软件| 国产精品99一区二区三区| 年轻bbwbbw高潮| 国产69精品久久久久777| 国产一区二区三区四区五区七| av素人在线| 午夜色影院| 99久久精品一区字幕狠狠婷婷 | 国产区精品区| 久久精品手机视频| 456亚洲精品| 国内少妇偷人精品视频免费| 狠狠插影院| 中文在线一区二区三区| 亚洲午夜精品一区二区三区电影院| 精品美女一区二区三区| 亚洲一级中文字幕| 免费久久一级欧美特大黄| 国产精品日韩一区二区| 欧美一区二区色| 午夜伦理片在线观看| 亚洲国产精品美女| 国91精品久久久久9999不卡| 日韩中文字幕亚洲精品欧美| 久99久视频| 精品一区二区三区影院| 一区二区国产精品| 国产一区二区三区乱码| 一区二区在线精品| 国产精品久久免费视频在线| 亚洲**毛茸茸| 久久精视频| 99久久久久久国产精品| 欧美日韩激情在线| 久久人91精品久久久久久不卡| 国产日韩一二三区| 精品在线观看一区二区| 99精品视频一区| 91丝袜国产在线播放| 久久综合激情网| 亚洲欧美国产一区二区三区 | 狠狠操很很干| 精品国产18久久久久久依依影院| 日韩精品乱码久久久久久| 91精品视频在线观看免费| 国产麻豆91视频| 亚洲伊人久久影院| 片毛片免费看| xxxx18hd护士hd护士| 久久人人爽爽| 人人澡超碰碰97碰碰碰| 日韩精品一区二区三区免费观看| 国产欧美一区二区三区不卡高清| 国产日韩欧美自拍| 97午夜视频| 欧美一区二区免费视频| 国产在线观看二区| 国产偷自视频区视频一区二区| 午夜黄色一级电影| 人人要人人澡人人爽人人dvd| 日本一区二区三区免费在线| 天堂av一区二区| 美女直播一区二区三区| 91久久免费| 久久午夜鲁丝片| 99国产精品免费| 日本亚洲国产精品| 欧美综合国产精品久久丁香| 午夜精品在线播放| 三级午夜片| 7799国产精品久久99| 999久久久国产精品| 国产91丝袜在线| 午夜免费片| 国产精品日韩一区二区三区| 久久精品综合| 一区二区国产精品| xoxoxo亚洲国产精品| 91九色精品| 国产精品第157页| 国产一区二区电影| 999国产精品999久久久久久| 三级午夜片| 欧美日韩一区二区三区精品| 麻豆视频免费播放| 欧美日韩一区二区三区四区五区| 91久久国语露脸精品国产高跟| 国产精品一区二区在线观看免费| 91麻豆精品国产91久久| 神马久久av| 久久综合二区| 亚洲一区中文字幕| 日韩国产精品久久| 国产精品久久久久久久久久久久久久久久久久 | 激情aⅴ欧美一区二区三区| 91丝袜国产在线播放| 亚洲1区2区3区4区| 狠狠色狠狠色综合系列| 亚洲精品乱码久久久久久按摩| 午夜裸体性播放免费观看| 国产一区二区三区伦理| 99爱精品视频| 538在线一区二区精品国产| 国产一区二区三区伦理| 午夜毛片在线| 国产精品久久久久久久四虎电影| 26uuu亚洲国产精品| 夜夜爽av福利精品导航| 99re国产精品视频| 国产全肉乱妇杂乱视频在线观看| 首页亚洲欧美制服丝腿| 日韩精品免费播放| 亚洲国产欧洲综合997久久,| 国产精一区二区三区| 欧美乱妇高清无乱码| 亚洲福利视频一区二区| 国产亚洲精品久久19p| 久久精品一二三四| 91理论片午午伦夜理片久久| 国产精品白浆视频| 国产精品视频1区| 欧美精品久久一区| 99国产精品久久久久| 国产目拍亚洲精品区一区| 欧美69精品久久久久久不卡| 蜜臀久久99静品久久久久久| 91精品一区二区中文字幕| 亚洲第一区国产精品| 中文字幕一区一区三区| 日韩精品久久久久久久电影99爱| 夜色av网站| 精品福利一区| 国产无套精品一区二区| 久久99久国产精品黄毛片入口| 爱看av在线入口| 日韩精品在线一区二区三区| 日韩欧美激情| 久久精品视频3| 欧美精品国产精品| 国产精品v欧美精品v日韩精品v| 亚洲一区2区三区| 国产农村乱色xxxx| 国产日韩欧美亚洲| 国产一区2| 性生交片免费看片| 午夜av资源| 日韩美一区二区三区| 国产麻豆精品一区二区| 91麻豆精品国产91久久久更新资源速度超快 | 欧美黄色一二三区| 国产日韩欧美自拍| 国产91精品一区| 日韩av在线网址| 国产乱老一区视频| 欧美精品粉嫩高潮一区二区| 欧美激情精品久久久久久免费| 国产v亚洲v日韩v欧美v片| 夜夜爱av| 综合久久一区| 国产suv精品一区二区4| 不卡在线一区二区| 国产精品二区在线| 国产精品无码永久免费888| **毛片在线| 99久久国产综合精品尤物酒店| 国产精品一二三区视频出来一| 国产精品天堂| 久久er精品视频| 欧美系列一区| 欧美激情视频一区二区三区| 国产日韩欧美二区| 日韩女女同一区二区三区| 日日夜夜精品免费看 | 欧美日本三级少妇三级久久| 日本高清h色视频在线观看| 免费午夜在线视频| 中文字幕一区一区三区| 亚洲**毛茸茸| 亚洲欧美一区二区三区不卡| 在线视频不卡一区| 国产视频一区二区不卡 | 国产偷国产偷亚洲清高| 久久综合伊人77777麻豆最新章节| 在线电影一区二区| 亚洲精品国产suv| 国产欧美一二三区| 片毛片免费看| 草逼视频网站| 国产中文字幕一区二区三区| 国产精品综合在线| 午夜肉伦伦影院九七影网| 国内少妇偷人精品视频免费| 日韩欧美激情| 欧美精品免费视频| 狠狠色噜噜狠狠狠狠88| 一区二区三区欧美视频| 好吊色欧美一区二区三区视频| 丰满岳妇伦4在线观看| 国产精品96久久久久久久| 亚洲乱码av一区二区三区中文在线:| 国产高清一区二区在线观看| 精品无码久久久久国产| 国产精品亚洲二区| 性国产日韩欧美一区二区在线| 亚洲欧美一区二区三区不卡| 久久综合国产伦精品免费| 国产大片黄在线观看私人影院| 亚洲一区中文字幕| 国产精品美女一区二区视频| 狠狠躁夜夜躁| 欧美性xxxxx极品少妇| 日本三级香港三级网站| 欧美一区二区三区在线视频观看| 精品久久久久久久久亚洲| 久久久久久亚洲精品| 亚洲欧美制服丝腿| 国产一区二区黄| 狠狠色丁香久久婷婷综合_中| 97人人模人人爽视频一区二区 | 国产99久久九九精品| 午夜裸体性播放免费观看| 国产欧美一区二区三区不卡高清| 亚洲精品一区二区三区香蕉| 最新国产精品自拍| 国产欧美精品va在线观看|