日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]文本相似度的統計方法及系統有效

專利信息
申請號: 201310074669.0 申請日: 2013-03-08
公開(公告)號: CN103176962A 公開(公告)日: 2013-06-26
發明(設計)人: 朱定局 申請(專利權)人: 深圳先進技術研究院
主分類號: G06F17/27 分類號: G06F17/27
代理公司: 廣州華進聯合專利商標代理有限公司 44224 代理人: 吳平
地址: 518055 廣東省深圳*** 國省代碼: 廣東;44
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 文本 相似 統計 方法 系統
【說明書】:

技術領域

發明涉及文本處理,特別是涉及一種文本相似度的統計方法,還涉及一種文本相似度的統計系統。

背景技術

現有技術中判斷兩個文本的相似度,一般是通過將兩個文本進行分詞,然后按照順序判斷兩個文本中重復的字詞句串。

但如果文本中字詞句的順序被故意打亂了,那么即使實質上是相似的(例如抄襲的)文本之間,按照現有的相似度統計方式得到的相似度較低,無法反映其本身的相似程度。

發明內容

基于此,為了解決傳統的文本相似度統計方法難以準確反映被人為打亂了字詞句順序的文本之間的相似程度的問題,有必要提供一種能夠較為準確反映被人為打亂了字詞句順序的文本之間的相似程度的文本相似度的統計方法。

一種文本相似度的統計方法,包括:獲取需要判別相似度的第一文本和第二文本;以第一劃分尺度將所述第一文本和第二文本分別分割成若干文本片段,將第一劃分尺度下第一文本中全部的文本片段與第二文本中全部的文本片段進行比較,計算第一劃分尺度下第一文本與第二文本中相同的文本片段數量占第一文本的文本片段總數的比例x1;自第一文本和第二文本中刪除相同的文本片段,分別得到第一剩余文本和第二剩余文本;以第二劃分尺度將第一剩余文本和第二剩余文本分別分割成若干文本片段,將第二劃分尺度下第一剩余文本中全部的文本片段與第二文本中全部的文本片段進行比較,計算第二劃分尺度下第一剩余文本與第二剩余文本中相同的文本片段數量占第一剩余文本的文本片段總數的比例y1;所述第二劃分尺度比第一劃分尺度小;將x1乘以第一劃分尺度在綜合相似度中的權重,得到第一劃分尺度的相似度,一減去第一劃分尺度的相似度后再乘以y1、接著加上第一劃分尺度的相似度,以計算第一文本與第二文本的綜合相似度。

在其中一個實施例中,所述以第一劃分尺度將所述第一文本和第二文本分別分割成若干文本片段的步驟,是將所述第一文本和第二文本分別分割成若干自然段;所述以第二劃分尺度將第一剩余文本和第二剩余文本分別分割成若干文本片段的步驟,是將所述第一剩余文本和第二剩余文本分別分割成若干詞語。

在其中一個實施例中,所述以第一劃分尺度將所述第一文本和第二文本分別分割成若干文本片段的步驟,是將所述第一文本和第二文本分別分割成若干句子;所述以第二劃分尺度將第一剩余文本和第二剩余文本分別分割成若干文本片段的步驟,是將所述第一剩余文本和第二剩余文本分別分割成若干詞語。

在其中一個實施例中,所述以第一劃分尺度將所述第一文本和第二文本分別分割成若干文本片段的步驟,是將所述第一文本和第二文本分別分割成若干自然段;所述以第二劃分尺度將第一剩余文本和第二剩余文本分別分割成若干文本片段的步驟,是將所述第一剩余文本和第二剩余文本分別分割成若干句子;所述文本相似度的統計方法還包括自第一剩余文本和第二剩余文本中刪除相同的句子,分別得到文本T5和文本T6,將文本T5和文本T6分別分割成若干詞語,將文本T5中全部的詞語和文本T6中全部的詞語進行比較,計算文本T5和文本T6中相同的詞語占文本T5中詞語總數的比例z1的步驟;所述計算第一文本與第二文本的綜合相似度的步驟,是通過如下公式進行計算:綜合相似度M1=x1*c1+(1-x1*c1)[y1*c2+(1-y1*c2)z1];其中c1為自然段尺度在綜合相似度中的權重,c2為句子尺度在綜合相似度中的權重。

在其中一個實施例中,還包括判斷所述第一文本與第二文本的綜合相似度是否大于相似度閾值,若是,則判定所述第一文本與第二文本相似的步驟。

在其中一個實施例中,還包括下列步驟:計算第一劃分尺度下第一文本與第二文本中相同的文本片段數量占第二文本的文本片段總數的比例x2;計算第二劃分尺度下第一剩余文本與第二剩余文本中相同的文本片段數量占第二剩余文本的文本片段總數的比例y2;將x2乘以第一劃分尺度在綜合相似度中的權重,得到第一劃分尺度的相似度,一減去第一劃分尺度的相似度后再乘以y2、接著加上第一劃分尺度的相似度,計算第二文本與第一文本的綜合相似度;判斷所述第一文本與第二文本的綜合相似度是否大于相似度閾值,所述第二文本與第一文本的綜合相似度是否大于所述相似度閾值,若二者有任意一個大于所述相似度閾值,則判定所述第一文本與第二文本相似。

本發明還相應提供一種文本相似度的統計系統。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳先進技術研究院,未經深圳先進技術研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201310074669.0/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 91久久久久久亚洲精品禁果| xxxxhdvideosex| 国产一区二区三区小说| 国产1区2区3区| 99视频国产精品| 激情aⅴ欧美一区二区三区| 国产一级片网站| 2023国产精品自产拍在线观看| 99热久久这里只精品国产www | 波多野结衣巨乳女教师| 国偷自产中文字幕亚洲手机在线| 精品国产一区二区三区免费| 久久er精品视频| 色婷婷精品久久二区二区蜜臂av| 国产精品一区二| 午夜精品一区二区三区三上悠亚 | 国产精品无码专区在线观看| 日韩欧美国产中文字幕| 国产一区2| 日韩中文字幕亚洲欧美| 久久免费视频一区| 国产精品综合在线观看| 国产一区二三| 午夜叫声理论片人人影院| 国产精品久久国产精品99 | 国产欧美一区二区精品性| 午夜wwww| 国产午夜精品一区二区三区欧美| 欧洲激情一区二区| 欧美资源一区| 国模一区二区三区白浆| 国产欧美日韩二区| 国产一区二区播放| 亚洲免费精品一区二区| 日韩久久精品一区二区三区| 91精品视频在线免费观看| 狠狠色噜噜狠狠狠狠米奇777| 亚洲福利视频一区| 国产日韩欧美不卡| 久久99国产精品视频| 精品久久不卡| 51区亚洲精品一区二区三区| 日韩免费一级视频| 国产69精品久久久久app下载| 一色桃子av| 国产伦高清一区二区三区| 一色桃子av大全在线播放| 久久一区二区精品| 色一情一乱一乱一区免费网站| 日日噜噜夜夜狠狠| 欧美一区二区在线不卡| 精品久久久久久亚洲综合网| av午夜电影| 日本久久不卡| 国产精品suv一区二区6| 狠狠色依依成人婷婷九月| 亚洲国产欧美一区| 亚洲欧洲国产伦综合| 91精品婷婷国产综合久久竹菊| 欧美乱战大交xxxxx| 国产日韩欧美一区二区在线观看| 精品久久久久久亚洲综合网| 久久久综合亚洲91久久98| 中文无码热在线视频| 91精品中综合久久久婷婷| 福利视频亚洲一区| 蜜臀久久99精品久久久| 九九久久国产精品| 浪潮av色| 2020国产精品自拍| 国产精品九九九九九九九| 精品香蕉一区二区三区| 中文字幕一区二区三区四| 久久久精品中文| 丰满少妇高潮惨叫久久久一| 精品久久香蕉国产线看观看gif| av午夜在线| 久久综合久久自在自线精品自| 欧美视频1区| 91精品国产综合久久婷婷香| 四虎国产永久在线精品| 躁躁躁日日躁网站| 国产真实一区二区三区| 欧美激情午夜| 好吊妞国产欧美日韩免费观看网站 | 在线视频不卡一区| 国产视频一区二区视频| 99re6国产露脸精品视频网站| 91亚洲精品国偷拍自产| 国产一区二区视频免费在线观看| 精品国产一区二区三区国产馆杂枝| 午夜剧场伦理| 国产精品亚洲二区| 91久久香蕉| 色一情一乱一乱一区免费网站| 国产一区在线精品| 日韩女女同一区二区三区| 国产一区二区三区国产| 国产精品电影一区| 国产精品九九九九九九九| 狠狠色噜噜狠狠狠狠综合久| 91精品久久天干天天天按摩| 午夜伦全在线观看| 免费观看xxxx9999片| 国产中文字幕91| 午夜伦全在线观看| 国产影院一区二区| 国产精品国产三级国产专播精品人 | 精品一区二区三区中文字幕| 日本美女视频一区二区三区| 91精品久久天干天天天按摩| 午夜色大片| 国产日韩欧美亚洲| 日本xxxx护士高潮hd| 久久夜靖品2区| 91国内精品白嫩初高生| 中文字幕区一区二| 午夜社区在线观看| 国产乱人伦精品一区二区| 欧美日韩亚洲国产一区| 国产精品中文字幕一区二区三区| 国产在线精品区| 7799国产精品久久99| 国产精品国外精品| 欧美hdxxxx| 欧美精品在线视频观看| 国产69久久| 久久一区二区精品| 日韩一区二区三区福利视频| 午夜私人影院在线观看| 久久久久久中文字幕| 欧美激情午夜| 国产美女三级无套内谢| 欧美精品二区三区| 日韩精品中文字幕一区| 狠狠色狠狠色88综合日日91| 国产一区二区国产| 91亚洲欧美日韩精品久久奇米色| 国产色99| 国产乱码一区二区三区| 亚洲四区在线观看| 精品国产91久久久久久久| 久久97国产| 福利视频亚洲一区| 农村妇女毛片精品久久| 91国偷自产中文字幕婷婷| 久久久精品99久久精品36亚| 国产精品日产欧美久久久久| 91久久一区二区| 日韩精品一区二区久久| 久久第一区| 7777久久久国产精品| 精品国产乱码久久久久久a丨| 午夜看片在线| 日本精品一区二区三区在线观看视频| 亚洲欧美日韩精品suv| 国产午夜精品理论片| 日韩av在线电影网| 香港三日本8a三级少妇三级99| 国产精品日韩一区二区三区| 欧美日韩精品在线播放| 国产91精品高清一区二区三区| _97夜夜澡人人爽人人| 欧美精品久久一区| 国产人澡人澡澡澡人碰视 | 午夜wwww| **毛片在线免费观看| 亚洲视频h| 亚洲va欧美va国产综合先锋| 午夜肉伦伦| 日韩女女同一区二区三区| 国产淫片免费看| 在线国产91| 免费xxxx18美国| 国产玖玖爱精品视频| 综合久久色| 日韩av三区| 7777久久久国产精品| 亚洲在线久久| 欧美xxxxxhd| 国产精品对白刺激久久久| 四虎影视亚洲精品国产原创优播| 中文字幕二区在线观看| 亚洲乱亚洲乱妇50p| 欧美日韩一级二级| 欧美精品国产精品| 精品久久久久久中文字幕大豆网| 久久精品一| 亚洲码在线| 国产欧美二区| 久久国产麻豆| 国产一二三区免费| 日本高清一二三区| 午夜黄色大片| 国产精品国外精品| 久久精视频| 九色国产精品入口| 午夜国产一区二区三区四区| 国产一区二区黄| 四季av中文字幕一区| 中文乱码字幕永久永久电影| 狠狠色狠狠色88综合日日91| 欧美激情午夜| 亚洲少妇中文字幕| 亚洲国产精品肉丝袜久久| 亚洲va国产| 欧美日韩国产色综合一二三四| 国产91九色视频| www色视频岛国| 亚洲网站久久| 欧美国产三区| 亚洲一区欧美| 91国偷自产一区二区介绍| 国产九九九精品视频| 亚洲精品久久在线| 久久青草欧美一区二区三区| 国产偷窥片| 日韩精品一区二区免费| 国产精品久久久麻豆| 狠狠色噜噜狠狠狠狠69| 欧美一区免费| 精品国精品国产自在久不卡| 亚洲国产精品日本| 久免费看少妇高潮a级特黄按摩| 亚洲国产精品一区二区久久hs| 精品久久国产视频| 久久久久亚洲| 一区二区三区香蕉视频| 国产91在线拍偷自揄拍| 欧美系列一区二区| 高清国产一区二区 | 日韩av三区| 亚洲精品久久久久不卡激情文学| 日本三级韩国三级国产三级| 国产亚洲欧美日韩电影网| 日韩精品久久一区二区| 玖玖国产精品视频| av毛片精品| 亚洲欧洲日韩在线| 国产伦精品一区二区三| 理论片午午伦夜理片在线播放| 国产理论一区| 96国产精品| 91avpro| 日本一区中文字幕| 亚洲精品国产一区二区三区|