日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種基于形態(tài)和語義相似度的對話短文本聚類方法有效

專利信息
申請?zhí)枺?/td> 201410235900.4 申請日: 2014-05-30
公開(公告)號: CN104008166B 公開(公告)日: 2017-05-24
發(fā)明(設(shè)計)人: 胡琴敏;陳國梁;楊河彬;羅念;鐘哲凡;裴逸鈞 申請(專利權(quán))人: 華東師范大學(xué)
主分類號: G06F17/30 分類號: G06F17/30
代理公司: 上海藍迪專利商標事務(wù)所(普通合伙)31215 代理人: 徐筱梅,張翔
地址: 200241 *** 國省代碼: 上海;31
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 一種 基于 形態(tài) 語義 相似 對話 文本 方法
【權(quán)利要求書】:

1.一種基于形態(tài)和語義相似度的對話短文本聚類方法,其特征在于該方法包括以下具體步驟:

步驟S1:對于中文短文本采用分詞工具進行分詞處理,然后利用正則匹配與字符串替換來過濾掉無效字符、連續(xù)空格、大小寫混用噪音信息;對于英文短文本采用詞干提取工具進行預(yù)處理;

步驟S2:利用TF-IDF和TextRank方法進行關(guān)鍵詞提取來獲取候選關(guān)鍵詞以及對應(yīng)的權(quán)重值;將去除噪音的短文本和關(guān)鍵詞集合相結(jié)合起來形成帶有權(quán)重值的格式化短文本;根據(jù)帶有權(quán)重的格式化短文本定義一種新的短文本和類中心的表示方式;

步驟S3:聚類開始的時候,類中心集合為空;當?shù)谝粋€對話短文本輸入之后,發(fā)現(xiàn)類中心集合為空,則以當前短文本為基礎(chǔ)建立一個類中心,并加入類中心集合;當?shù)诙€短文本輸入之后,遍歷類中心集合發(fā)現(xiàn)存在一個類中心,根據(jù)短文本和類中心的表示方式,結(jié)合形態(tài)和語義因素來計算當前短文本與類中心的相似度距離D;形態(tài)因素采用編輯距離相似度;語義因素采用知網(wǎng)、同義詞林和WordNet知識庫的詞語語義相似度;如果D小于閾值T,則將該對話短文本加入該類中心并更新該類中心;否則從類中心集合中取下一個類中心進行同樣判斷,當遍歷完了類中心集合之后依舊沒有符合要求的類中心,則需要以該短文本為基礎(chǔ)建立一個新的類中心并加入類中心集合;依次循環(huán)上述過程,直到所有對話短文本完成聚類;最終的類中心集合則為所需聚類結(jié)果,每個對話短文本與最終類中心集合中哪個類中心的相似度距離最小,則該對話短文本就屬于這個類:其中:

所述步驟S1中新的對話短文本與類中心的表示方式為:

ⅰ)短文本ST由原始短文本RST、規(guī)整化字符串文本FST和關(guān)鍵詞集合KWL三部分組成,其短文本ST的數(shù)學(xué)描述為:ST={RST,FST/WT,KWL=[KW1/wt1,...,KWi/wti,...]},WT表示FST的權(quán)重,wti表示KWi的權(quán)重;

ⅱ)類中心Center由類標號CID、類權(quán)重CWT、類成員數(shù)目CMN、原始短文本集合CRSTL、規(guī)整化字符串文本集合CFSTL和關(guān)鍵詞集合CKWL組成,其類中心Center的數(shù)學(xué)描述為:

WTj表示FSTj的權(quán)重,wtk表示KWk的權(quán)重。

2.根據(jù)權(quán)利要求1所述的方法,其特征在于所述步驟S3中結(jié)合形態(tài)和語義因素來計算當前短文本與類中心的相似度距離D,具體包括:

基于ST、Center表示形式,結(jié)合編輯距離相似度和詞語語義相似度來計算短文本相似度Simi,相似度距離D=1-Simi,其中編輯距離相似度表示為FSimi,詞語語義相似度表示為SSimi;

其中為編輯距離相似度的權(quán)重因子,即形態(tài)因素在相似度計算中所占比例;Simi(STA,STB)表示STA和STB的相似度,F(xiàn)Simi(STA.FST,STB.FST)表示規(guī)整化文本字符串的編輯距離相似度,SSimi(STA.KWL,STB.KWL)表示STA和STB的語義相似度;

FSimi(STA.FST,STB.FST)=Levenshtein(STA.FST,STB.FST) (1)

<mrow><mtable><mtr><mtd><mrow><mi>S</mi><mi>S</mi><mi>i</mi><mi>m</mi><mi>i</mi><mrow><mo>(</mo><msub><mi>ST</mi><mi>A</mi></msub><mo>.</mo><mi>K</mi><mi>W</mi><mi>L</mi><mo>,</mo><msub><mi>ST</mi><mi>B</mi></msub><mo>.</mo><mi>K</mi><mi>W</mi><mi>L</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mn>1</mn><mn>2</mn></mfrac><mo>{</mo><mfrac><mrow><munder><mi>&Sigma;</mi><mrow><msub><mi>w</mi><mi>A</mi></msub><mo>&Element;</mo><msub><mi>ST</mi><mi>A</mi></msub><mo>.</mo><mi>K</mi><mi>W</mi><mi>L</mi></mrow></munder><mrow><mo>(</mo><mi>max</mi><mi> </mi><mi>S</mi><mi>S</mi><mi>i</mi><mi>m</mi><mi>i</mi><mo>(</mo><mrow><msub><mi>w</mi><mi>A</mi></msub><mo>,</mo><msub><mi>ST</mi><mi>B</mi></msub><mo>.</mo><mi>K</mi><mi>W</mi><mi>L</mi></mrow><mo>)</mo><mo>*</mo><msub><mi>wt</mi><mi>A</mi></msub><mo>)</mo></mrow></mrow><mrow><munder><mi>&Sigma;</mi><mrow><msub><mi>w</mi><mi>A</mi></msub><mo>&Element;</mo><msub><mi>WS</mi><mi>A</mi></msub></mrow></munder><msub><mi>wt</mi><mi>A</mi></msub></mrow></mfrac></mrow></mtd></mtr><mtr><mtd><mrow><mo>+</mo><mfrac><mrow><munder><mi>&Sigma;</mi><mrow><msub><mi>w</mi><mi>B</mi></msub><mo>&Element;</mo><msub><mi>ST</mi><mi>B</mi></msub><mo>.</mo><mi>K</mi><mi>W</mi><mi>L</mi></mrow></munder><mrow><mo>(</mo><mi>max</mi><mi> </mi><mi>S</mi><mi>S</mi><mi>i</mi><mi>m</mi><mi>i</mi><mo>(</mo><mrow><msub><mi>w</mi><mi>B</mi></msub><mo>,</mo><msub><mi>ST</mi><mi>A</mi></msub><mo>.</mo><mi>K</mi><mi>W</mi><mi>L</mi></mrow><mo>)</mo><mo>*</mo><msub><mi>wt</mi><mi>B</mi></msub><mo>)</mo></mrow></mrow><mrow><munder><mi>&Sigma;</mi><mrow><msub><mi>w</mi><mi>B</mi></msub><mo>&Element;</mo><msub><mi>WS</mi><mi>B</mi></msub></mrow></munder><msub><mi>wt</mi><mi>B</mi></msub></mrow></mfrac></mrow></mtd></mtr></mtable><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mrow>

公式(2)中wti作為權(quán)重因素融入計算語義相似度。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會員可以免費下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華東師范大學(xué),未經(jīng)華東師范大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201410235900.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實用新型專利、外觀設(shè)計專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖;

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關(guān)于我們 尋求報道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 欧美精品八区| 精品国产一区二区三| 亚洲精品日本久久一区二区三区| 97人人澡人人添人人爽超碰| 午夜影院5分钟| 99久久精品免费视频| 国产精品久久久久久久新郎| 日韩av免费电影| 久久夜色精品久久噜噜亚| 欧美久久精品一级c片| 国产欧美视频一区二区三区| 国产欧美一区二区三区视频| 午夜激情综合网| 国产亚洲精品久久yy50| 欧美大成色www永久网站婷| 欧美日韩亚洲国产一区| 97精品国产97久久久久久免费| 国产99久久九九精品| 亚洲综合日韩精品欧美综合区| 日韩精品一区二区三区在线| 日韩精品一区中文字幕| 久久综合狠狠狠色97| 中文字幕精品一区二区三区在线| 国产一区二区在线免费| 少妇av一区二区三区| 久久精品国产精品亚洲红杏| 日韩av在线网| 欧美在线播放一区| 久久精品麻豆| 欧美freesex极品少妇| 午夜毛片影院| 国产精品一区二区日韩新区| 国产精自产拍久久久久久蜜 | 亚洲精品中文字幕乱码三区91| 91avpro| 国产麻豆91欧美一区二区| 综合久久一区二区三区| 久久精品国产久精国产| 精品国产一区二区三区麻豆免费观看完整版| 国产精品高潮在线| 欧美日韩一区二区三区免费| 国产精品一二三四五区| 制服.丝袜.亚洲.另类.中文| 日本一区午夜艳熟免费| 毛片大全免费看| 一区二区在线精品| xoxoxo亚洲国产精品| 国产精品久久久久久久久久久久久久久久久久 | 欧美三区视频| 欧美在线视频一二三区| 97人人揉人人捏人人添| 欧美乱妇高清无乱码| 日韩午夜一区| 久久久99精品国产一区二区三区| 日韩一区高清| 一区二区三区精品国产| 亚洲国产欧美一区二区三区丁香婷| 国产电影一区二区三区下载| 日韩a一级欧美一级在线播放| 欧美乱大交xxxxx古装| 欧美日韩一区二区在线播放| 国产白丝一区二区三区| 精品久久9999| 久久久一区二区精品| 国产精品美女一区二区视频| 午夜wwww| 久久激情影院| 午夜影院试看五分钟| 国产精品国产三级国产专区55| 精品一区二区三区视频?| 欧美日韩精品在线播放| 亚洲欧美一二三| 国产在线精品二区| 高清人人天天夜夜曰狠狠狠狠| 精品国产伦一区二区三区| 久久夜靖品2区| 中文av一区| 久久婷婷国产麻豆91天堂徐州| 欧美午夜理伦三级在线观看偷窥| xx性欧美hd| 日韩精品中文字幕一区二区| 欧美在线视频一二三区| 91精品夜夜| 久久一级精品视频| 国产精品96久久久| 日韩av在线导航| 91久久国产露脸精品国产护士| 国产精品入口麻豆九色| 国产午夜亚洲精品| 久久久99精品国产一区二区三区| 亚洲欧洲日本在线观看| 国产亚洲精品久久久456| 91视频国产九色| 强制中出し~大桥未久在线播放 | 国产一区二区二| 免费**毛片| 狠狠色丁香久久婷婷综| 国产精品久久久综合久尹人久久9| 国产精品久久久久久久久久久不卡| 国产高清在线一区| 国产精品一区在线观看你懂的| 99久久精品国产国产毛片小说| 国产精品一区二区麻豆| 欧美日韩卡一卡二| 久久aⅴ国产欧美74aaa| 国产午夜一区二区三区| 日本三级不卡视频| 欧美二区在线视频| 欧美极品少妇xx高潮| 日本一二三不卡| 99国产精品久久久久老师| 精品国产一区二区三区高潮视| 亚洲第一天堂无码专区| 日韩av中文字幕在线| 精品少妇一区二区三区免费观看焕 | 麻豆精品久久久| 狠狠操很很干| 一区二区三区欧美精品| 国产精品偷伦一区二区| 狠狠色噜噜狠狠狠狠88| 日本边做饭边被躁bd在线看| 日韩av中文字幕一区二区| 国产午夜亚洲精品午夜鲁丝片| 国产欧美一区二区精品久久久| 高清国产一区二区三区| 毛片免费看看| 麻豆精品国产入口| 日本久久丰满的少妇三区| 夜夜精品视频一区二区| 精品久久综合1区2区3区激情| 日韩亚洲国产精品| 91精品视频一区二区三区| 高清欧美xxxx| 精品国产18久久久久久依依影院| 日本午夜久久| 97久久精品人人做人人爽| 四季av中文字幕一区| 国产精品一区亚洲二区日本三区 | 夜夜夜夜夜猛噜噜噜噜噜gg| 中文字幕区一区二| 亚洲欧美制服丝腿| 国产一级在线免费观看| 国产在线精品一区| 久久精品国产亚洲7777| 一级午夜电影| 亚洲乱码av一区二区三区中文在线:| 国产69精品久久久久按摩 | 91免费国产视频| 中文无码热在线视频| 欧美午夜羞羞羞免费视频app| 午夜一级免费电影| 日日夜夜一区二区| 91久久综合亚洲鲁鲁五月天| 欧美一区二区三区四区五区六区 | 一区二区三区欧美视频| 一区二区不卡在线| 波多野结衣女教师30分钟| 精品国产区| 91偷自产一区二区三区精品| 99久久国产综合| 午夜特片网| 久久97国产| 国产视频二区| 国产精品中文字幕一区| 欧美日韩一区二区三区在线播放| 狠狠色狠狠色综合日日2019| 一级久久精品| 91久久国产露脸精品国产护士| 日本高清一二区| 狠狠躁夜夜躁| 国产午夜亚洲精品羞羞网站 | 国产一区二区三区久久久| 久久不卡精品| 日韩精品免费一区二区三区| 狠狠色噜噜狠狠狠狠69| 国产精品奇米一区二区三区小说| 国内精品久久久久影院日本| 精品国产二区三区| 亚洲精品国产91| 亚洲精品一区二区三区香蕉| 久久综合国产精品| 午夜666| 国产精品一级在线| 999久久久国产精品| 欧美一区二区激情三区| 欧美精品一卡二卡| 国产精品999久久久| 亚洲国产精品激情综合图片| 国产91电影在线观看| 欧美极品少妇| 国产一区二区伦理| 91精品国产综合久久婷婷香| 午夜影院h| 91精品高清| 精品国产仑片一区二区三区| 国91精品久久久久9999不卡| 久久精品视频3| 欧美午夜理伦三级在线观看偷窥| 国产精品天堂网| 欧美hdfree性xxxx| 午夜伦理片在线观看| 日本久久不卡| 欧美日韩国产精品综合| 香蕉av一区二区| 中文字幕国内精品| 日韩国产精品久久久久久亚洲| 日韩精品免费播放| 中文字幕精品一区二区三区在线| 国产美女三级无套内谢| 国产一区在线精品| 亚洲精品20p| www.午夜av| 亚洲欧美自拍一区| 91偷拍网站| 欧美日韩精品在线一区| 国产精品久久久久久久久久久久久久久久 | 国产欧美日韩va另类在线播放| 一区二区在线不卡| 日韩一区二区三区福利视频| 国产在线精品一区| 国产精品视频一二区| 欧美一区二区三区性| 精品国产伦一区二区三区| 99精品国产一区二区三区不卡| 一区二区三区欧美视频| 国产精品视频1区2区3区| 91精品视频在线观看免费| 黄色国产一区二区| 久久激情影院| 色偷偷一区二区三区| 清纯唯美经典一区二区| 欧美亚洲视频二区| 午夜激情看片| 亚洲少妇一区二区| 日韩精品久久久久久久电影99爱| 91精品久久久久久综合五月天| 91亚洲精品国偷拍自产| 91超薄丝袜肉丝一区二区| 国产精品白浆视频| 国产农村乱色xxxx| 日韩精品中文字幕一区二区三区| 精品福利一区二区| 日本一区二区电影在线观看| 一区二区91| 国精偷拍一区二区三区| 国产欧美日韩va另类在线播放|