日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種數(shù)據(jù)的聚類方法和聚類裝置在審

專利信息
申請(qǐng)?zhí)枺?/td> 201611032182.6 申請(qǐng)日: 2016-11-22
公開(公告)號(hào): CN106776751A 公開(公告)日: 2017-05-31
發(fā)明(設(shè)計(jì))人: 謝瑜;張昊;朱頻頻 申請(qǐng)(專利權(quán))人: 上海智臻智能網(wǎng)絡(luò)科技股份有限公司
主分類號(hào): G06F17/30 分類號(hào): G06F17/30
代理公司: 北京布瑞知識(shí)產(chǎn)權(quán)代理有限公司11505 代理人: 孟潭
地址: 201803 上海市嘉*** 國省代碼: 上海;31
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 一種 數(shù)據(jù) 方法 裝置
【說明書】:

技術(shù)領(lǐng)域

發(fā)明涉及一種數(shù)據(jù)處理方法和裝置,特別是涉及一種語料數(shù)據(jù)的處理方法和裝置。

背景技術(shù)

在語言處理的自動(dòng)問答領(lǐng)域中,需要對(duì)以語言為載體的問題進(jìn)行確定,進(jìn)而建立問題與答案的對(duì)應(yīng)關(guān)系,建立相似問題的問題集,即問題集的聚合是確定“問題-答案”業(yè)務(wù)邏輯的基礎(chǔ)技術(shù)和重要步驟。

在問題集的聚合處理過程中,現(xiàn)有技術(shù)采用自動(dòng)聚類,對(duì)相似問題語句進(jìn)行聚類形成不同的問題集。在聚類過程中需要確定聚類中心的數(shù)量和初始位置,以反映聚類中心的類間相異度。然后進(jìn)行聚類的迭代過程,直至聚類中心位置確定或達(dá)到預(yù)設(shè)精度或迭代次數(shù)。

由于問題集中存在一些特征分布稀疏不均勻的問題語句數(shù)據(jù),使得聚類區(qū)域的大小和形狀不規(guī)整,因此使得類間相異度量難于確定,聚類中心數(shù)量和初始位置無法優(yōu)化。這就造成進(jìn)行大樣本的問題集的聚類時(shí),對(duì)噪聲問題和離群孤立問題語句數(shù)據(jù)較敏感,使得少量數(shù)據(jù)對(duì)聚類結(jié)果產(chǎn)生較大影響,往往不能形成問題集的最優(yōu)聚類。

發(fā)明內(nèi)容

有鑒于此,本發(fā)明實(shí)施例提供了一種數(shù)據(jù)的聚類方法和聚類裝置,用于解決現(xiàn)有問題集聚類過程中,受初始條件影響聚類效果差的技術(shù)問題。

本發(fā)明實(shí)施例的數(shù)據(jù)的聚類方法包括:

獲取待處理數(shù)據(jù),所述待處理數(shù)據(jù)包括測試數(shù)據(jù)和非測試數(shù)據(jù);

對(duì)測試數(shù)據(jù)進(jìn)行第一分類處理,得到第一分類結(jié)果;

采用初始預(yù)設(shè)值對(duì)測試數(shù)據(jù)進(jìn)行第二分類處理,得到第二分類結(jié)果,所述第二分類處理包括:分別獲取第M句數(shù)據(jù)的句向量與已聚類的L個(gè)信息組的句向量平均值之間的最大相似度值,當(dāng)所述最大相似度值大于所述初始預(yù)設(shè)值時(shí),將第M句數(shù)據(jù)聚類到所述最大相似度值對(duì)應(yīng)的信息組中;當(dāng)所述最大相似度值小于所述初始預(yù)設(shè)值時(shí),將第M句數(shù)據(jù)作為第L+1個(gè)信息組,所述L小于或等于M-1;

比較所述第二分類結(jié)果和所述第一分類結(jié)果,當(dāng)以第一分類結(jié)果為標(biāo)準(zhǔn)得到第二分類結(jié)果的準(zhǔn)確率大于或等于閾值時(shí),將所述初始預(yù)設(shè)值作為目標(biāo)預(yù)設(shè)值;當(dāng)以第一分類結(jié)果為標(biāo)準(zhǔn)得到第二分類結(jié)果的準(zhǔn)確率小于閾值時(shí),不斷調(diào)整所述初始預(yù)設(shè)值,直至將所述初始預(yù)設(shè)值調(diào)整為目標(biāo)預(yù)設(shè)值時(shí)得到新的第二分類結(jié)果的準(zhǔn)確率大于或等于閾值;

采用目標(biāo)預(yù)設(shè)值對(duì)非測試數(shù)據(jù)進(jìn)行第二分類處理。

本發(fā)明實(shí)施例的數(shù)據(jù)的聚類裝置包括:

數(shù)據(jù)獲取模塊,用于獲取待處理數(shù)據(jù),將待處理數(shù)據(jù)劃分為測試數(shù)據(jù)和非測試數(shù)據(jù);

第一分類模塊,用于對(duì)測試數(shù)據(jù)進(jìn)行第一分類處理,得到第一分類結(jié)果;

第二分類模塊,用于采用初始預(yù)設(shè)值對(duì)測試數(shù)據(jù)進(jìn)行第二分類處理,得到第二分類結(jié)果,用于采用目標(biāo)預(yù)設(shè)值對(duì)非測試數(shù)據(jù)進(jìn)行分類處理;進(jìn)一步用于分別獲取第M句數(shù)據(jù)的句向量與已聚類的L個(gè)信息組的句向量平均值之間的最大相似度值,當(dāng)所述最大相似度值大于所述初始預(yù)設(shè)值時(shí),將第M句數(shù)據(jù)聚類到所述最大相似度值對(duì)應(yīng)的信息組中;當(dāng)所述最大相似度值小于所述初始預(yù)設(shè)值時(shí),將第M句數(shù)據(jù)作為第L+1個(gè)信息組,所述L小于或等于M-1;

參數(shù)確定模塊,用于比較第二分類結(jié)果和第一分類結(jié)果,當(dāng)以第一分類結(jié)果為標(biāo)準(zhǔn)得到第二分類結(jié)果的準(zhǔn)確率大于或等于閾值時(shí),將初始預(yù)設(shè)值作為目標(biāo)預(yù)設(shè)值;當(dāng)以第一分類結(jié)果為標(biāo)準(zhǔn)得到第二分類結(jié)果的準(zhǔn)確率小于閾值時(shí),不斷調(diào)整初始預(yù)設(shè)值,直至將初始預(yù)設(shè)值調(diào)整為目標(biāo)預(yù)設(shè)值時(shí)得到新的第二分類結(jié)果的準(zhǔn)確率大于或等于閾值。

本發(fā)明的聚類方法和聚類裝置將向量化的語料數(shù)據(jù)中的測試數(shù)據(jù)用于半監(jiān)督學(xué)習(xí)的聚類和自動(dòng)聚類,并根據(jù)半監(jiān)督學(xué)習(xí)的聚類結(jié)果調(diào)整自動(dòng)聚類算法的初始預(yù)設(shè)值形成目標(biāo)預(yù)設(shè)值,使得自動(dòng)聚類算法的聚類結(jié)果與半監(jiān)督學(xué)習(xí)的聚類結(jié)果滿足趨同。這樣利用采用目標(biāo)預(yù)設(shè)值的自動(dòng)聚類算法對(duì)向量化的語料數(shù)據(jù)中的非測試數(shù)據(jù)進(jìn)行聚類,可以有效提高初始分類數(shù)據(jù)的準(zhǔn)確性,改善聚類模型的聚類中心的初始參數(shù),使得類間相異度獲得保證,聚類中心位置也可以很好的確定聚類模型的穩(wěn)定性。使得實(shí)際應(yīng)用中問題集的聚類效果準(zhǔn)確,問題有效分組。

附圖說明

圖1為本發(fā)明的數(shù)據(jù)的聚類方法一實(shí)施例的流程圖。

圖2為本發(fā)明的數(shù)據(jù)的聚類方法一實(shí)施例的第二分類處理的流程圖。

圖3為本發(fā)明的數(shù)據(jù)的聚類裝置一實(shí)施例的架構(gòu)示意圖。

具體實(shí)施方式

下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海智臻智能網(wǎng)絡(luò)科技股份有限公司,未經(jīng)上海智臻智能網(wǎng)絡(luò)科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201611032182.6/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說明:

1、專利原文基于中國國家知識(shí)產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級(jí)中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級(jí)為極速版,下載速度顯著提升!歡迎使用!

請(qǐng)您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊(cè)】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識(shí) 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢?cè)诰€客服咨詢?cè)诰€客服
tel code back_top
主站蜘蛛池模板: 国产日韩欧美精品| av午夜在线| 激情久久综合| 手机看片国产一区| 欧美综合国产精品久久丁香| 一区二区三区欧美在线| ass韩国白嫩pics| 久久国产精品视频一区| 日本一区二区三区免费播放| 狠狠躁狠狠躁视频专区| 亚洲日本国产精品| 99久久夜色精品| 精品久久久久一区二区| 色一情一乱一乱一区免费网站| 国产精品亚州| 国产精品一级片在线观看| 91秒拍国产福利一区| 高清欧美xxxx| 久久国产免费视频| 精品国产一区二区三区免费| 麻豆天堂网| 久久精品国产久精国产| 午夜社区在线观看| 中文字幕日韩一区二区| 国产主播啪啪| 欧美日韩国产欧美| 欧美一区二区免费视频| 国产精品剧情一区二区三区| 强制中出し~大桥未久10在线播放| 日本精品一二区| 大bbw大bbw巨大bbb| 亚洲欧美一卡二卡| 国产一区影院| 亚洲精品www久久久久久广东| 欧美激情视频一区二区三区免费| 欧美一区二区三区四区五区六区| 精品99免费视频| 国产欧美精品一区二区三区小说 | 亚洲精品97久久久babes| 精品一区二区超碰久久久| 91精品国产高清一区二区三区| 国内精品在线免费| 国内少妇自拍视频一区| 欧美一区二区三区黄| 亚洲国产精品一区在线观看| 免费午夜在线视频| 国产乱xxxxx97国语对白| 特级免费黄色片| 日韩国产精品久久| 4399午夜理伦免费播放大全| 国产伦精品一区二区三区照片91 | 欧美日韩国产91| 日韩欧美中文字幕精品| 免费看性生活片| 国产一级片子| 羞羞免费视频网站| 久久91精品国产91久久久| 国产一二三区免费| 国产丝袜一区二区三区免费视频| 精品国产精品亚洲一本大道| 一区二区三区国产精华| 高清欧美xxxx| 欧美一区二区三区精品免费| 国产亚洲精品精品国产亚洲综合| 玖玖玖国产精品| 国产麻豆一区二区三区在线观看| 在线精品国产一区二区三区 | www.久久精品视频| 国产精品欧美一区二区视频| 国产在线精品一区二区在线播放| 91精品国产影片一区二区三区| 韩国视频一区二区| 久久精品国产综合| 国产一区二区三区的电影| 美女直播一区二区三区| 国产欧美精品va在线观看| 国产精品偷乱一区二区三区| 国产精品18久久久久白浆| 中文字幕欧美日韩一区| 狠狠躁日日躁狂躁夜夜躁| 一区二区三区四区视频在线| 91精品视频在线免费观看| 高清欧美精品xxxxx| 91精品国产九九九久久久亚洲| 国产丝袜在线精品丝袜91| free性欧美hd另类丰满| 欧美日韩国产一二| 亚洲1区在线观看| 欧美精品国产一区二区| 日本精品视频一区二区三区| 国产精品九九九九九| 国产视频二区| 免费91麻豆精品国产自产在线观看| 国产精品亚洲精品一区二区三区| 日韩一级视频在线| 日韩av在线一区| 欧美精品一卡二卡| 国产精品视频1区| 亚洲精品日本久久一区二区三区| 精品久久9999| 国产69精品99久久久久久宅男| 国产欧美一区二区精品婷| xxxx18hd护士hd护士| 欧美精品九九| 91精品高清| 亚洲欧美日韩一级| 国产在线拍偷自揄拍视频| 91免费视频国产| 狠狠色噜噜狠狠狠狠69| 99国产精品一区| 97精品久久久午夜一区二区三区| 中文字幕在线一二三区| 国产天堂一区二区三区| 国产一区二区精品在线| 日韩精品人成在线播放| 国产午夜精品一区| 国产高清无套内谢免费| 91亚洲精品国偷拍自产| 国产伦精品一区二区三区免费优势| 四季av中文字幕一区| 国产精品视频一区二区在线观看| 国内揄拍国产精品| 午夜激情影院| 在线国产91| 97人人澡人人爽91综合色| 国产大片黄在线观看私人影院 | 国产区一区| 国产精品久久久不卡| 国产福利一区在线观看| 日韩精品久久久久久中文字幕8| 久久一级精品| 在线精品视频一区| 毛片大全免费观看| 亚洲一二三在线| 亚洲欧美v国产一区二区| 精品国产品香蕉在线| 国产精品视频1区2区3区| 日韩精品人成在线播放| 亚洲神马久久| 国产欧美日韩精品一区二区三区| 精品久久久影院| 午夜一区二区三区在线观看| 久久免费视频一区| 亚洲欧美日韩精品在线观看| 色乱码一区二区三区网站| 91超碰caoporm国产香蕉| 亚洲精品少妇久久久久| 7799国产精品久久99| 天堂av一区二区| 国产一区2| 国产精品无码专区在线观看| 国产69精品久久久久按摩| a级片一区| 国产三级国产精品国产专区50| 99色精品视频| 制服.丝袜.亚洲.另类.中文| 国产日韩一区二区三区| 亚洲精品少妇久久久久| 精品福利一区| 亚洲精品456| 日本一区二区三区免费播放| 中文字幕一区二区三区不卡| 午夜av资源| 久久久久国产亚洲日本| 国产丝袜在线精品丝袜91| 亚洲精品欧美精品日韩精品| 国产欧美一区二区精品性色超碰| 日韩av在线播| 中文字幕理伦片免费看| 国内精品国产三级国产99| 亚洲欧洲日本在线观看| xxxxx色| 国产精品电影免费观看| 国产一区2| 国产精品国产三级国产专区55| 国产天堂一区二区三区| 日本一区二区高清| 欧美精品一区二区性色| 中文字幕1区2区3区| 国产另类一区| 国产精品乱码久久久久久久久| 国产精自产拍久久久久久蜜| 国产一区二区在线观看免费| 国产在线视频99| 精品国产乱码久久久久久久久| 国产乱人伦精品一区二区| 在线亚洲精品| 色偷偷一区二区三区| 国产日韩欧美中文字幕| 国产特级淫片免费看| 久久久久久亚洲精品| 性xxxxfreexxxxx交| 国产日韩麻豆| 欧美国产一区二区在线| 国产一区二区三区午夜| 欧美一区二区色| 国产精品久久久久久久久久久久久久不卡 | 午夜激情在线播放| 中文乱码字幕永久永久电影| 欧美视屏一区二区| 久久99精品久久久秒播| 91亚洲国产在人线播放午夜| 国产欧美一区二区三区沐欲| 国91精品久久久久9999不卡| 午夜毛片在线看| 久久99国产精品视频| 国产日产精品一区二区三区| 国产精品亚洲精品一区二区三区| 国产大学生呻吟对白精彩在线| 精品久久一区| 狠狠色噜噜狠狠狠狠69| 国产高清一区在线观看| 一区二区欧美精品| 亚州精品国产| 日日夜夜亚洲精品| 欧美日本91精品久久久久| 日韩亚洲精品在线观看| 欧美一区视频观看| 91午夜在线观看| 国产97在线播放| 在线国产一区二区三区| 99er热精品视频国产| 国产一区二区三区大片| 国产91精品一区二区麻豆亚洲| 91精品视频一区二区三区| 久久一区二区三区欧美| 欧美极品少妇xx高潮| 91麻豆精品国产91久久久无限制版| 国产欧美二区| 99精品国产一区二区三区不卡| 欧美一区二区三区久久精品| 午夜老司机电影| 国产一区在线视频播放| 国产一区二区精品在线| 国产日韩欧美第一页| 久久97国产| 中文字幕一区二区三区不卡| 亚洲精品日韩色噜噜久久五月| 久久综合国产伦精品免费| 国产一区二区精品免费| 欧美性受xxxx狂喷水| 狠狠躁狠狠躁视频专区| 国产精品白浆视频| 国产69精品久久久久777糖心| 国产精品一区二区6| 国产日韩欧美色图|