[發(fā)明專(zhuān)利]一種會(huì)話場(chǎng)景文本挖掘的方法及計(jì)算裝置在審
| 申請(qǐng)?zhí)枺?/td> | 201811208617.7 | 申請(qǐng)日: | 2018-10-17 |
| 公開(kāi)(公告)號(hào): | CN111061865A | 公開(kāi)(公告)日: | 2020-04-24 |
| 發(fā)明(設(shè)計(jì))人: | 徐樂(lè)樂(lè) | 申請(qǐng)(專(zhuān)利權(quán))人: | 武漢斗魚(yú)網(wǎng)絡(luò)科技有限公司 |
| 主分類(lèi)號(hào): | G06F16/35 | 分類(lèi)號(hào): | G06F16/35;G06F16/332 |
| 代理公司: | 北京眾達(dá)德權(quán)知識(shí)產(chǎn)權(quán)代理有限公司 11570 | 代理人: | 徐松 |
| 地址: | 430000 湖北省武漢市東湖開(kāi)*** | 國(guó)省代碼: | 湖北;42 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 會(huì)話 場(chǎng)景 文本 挖掘 方法 計(jì)算 裝置 | ||
本申請(qǐng)實(shí)施例公開(kāi)了一種會(huì)話場(chǎng)景文本挖掘的方法,用于提煉主播過(guò)程中的具體聊天場(chǎng)景,為機(jī)器人提供針對(duì)場(chǎng)景的會(huì)話答復(fù),使得機(jī)器人更加智能化,提高用戶(hù)體驗(yàn)。本申請(qǐng)實(shí)施例方法包括:根據(jù)文本距離計(jì)算公式計(jì)算N個(gè)文本中任意兩個(gè)文本之間的距離d(ti,tj);選擇任意兩個(gè)文本之間的距離中最大距離對(duì)應(yīng)的兩個(gè)文本t1和t2;當(dāng)簇中心點(diǎn)的個(gè)數(shù)為k為2時(shí),根據(jù)文本距離計(jì)算公式,將N?k個(gè)文本分配到k個(gè)簇集合中;根據(jù)中心點(diǎn)最優(yōu)函數(shù)計(jì)算每個(gè)簇集合中的新中心點(diǎn);在每個(gè)簇集合中,選取新中心點(diǎn);根據(jù)標(biāo)準(zhǔn)測(cè)度函數(shù)公式計(jì)算第一次分配的分配誤差Gi和第二次分配的分配誤差Gj;當(dāng)|Gi?Gj|≤ε時(shí),停止迭代。
技術(shù)領(lǐng)域
本申請(qǐng)涉及大數(shù)據(jù)領(lǐng)域,尤其涉及一種會(huì)話場(chǎng)景文本挖掘的方法及計(jì)算裝置。
背景技術(shù)
隨著科技的發(fā)展,聊天機(jī)器人(Chatbot)越來(lái)越成為重要的溝通工具,維基百科將聊天機(jī)器人定義為:通過(guò)聽(tīng)覺(jué)或文本方法進(jìn)行對(duì)話的計(jì)算機(jī)程序。但現(xiàn)在的市場(chǎng)輿論認(rèn)為機(jī)器人是下一個(gè)大變革:一種能立即接近客戶(hù)的方式。專(zhuān)家預(yù)估,到了2021年有超過(guò)50%的企業(yè)每年會(huì)花在聊天機(jī)器人的投資將超過(guò)傳統(tǒng)計(jì)算機(jī)應(yīng)用程序(Application,App),這揭示了聊天機(jī)器人是未來(lái)改變做生意以及客服方式的那把鑰匙。
聊天機(jī)器人創(chuàng)造了一個(gè)新的層次,使消費(fèi)者和品牌之間有了即時(shí)可及性、始終在線服務(wù)、和超人的能力。從用戶(hù)的電腦屏幕到用戶(hù)的手機(jī)到用戶(hù)的廚房柜臺(tái),到處都可以是它們。當(dāng)今的公司面臨著日益不可能做到的完美服務(wù)需求(每天24小時(shí),每周7天),聊天機(jī)器人由此變得更有吸引力。
一般用戶(hù)想聊天機(jī)器人的回復(fù)更人性化,會(huì)設(shè)計(jì)一個(gè)通用回復(fù)和針對(duì)特定的場(chǎng)景的個(gè)性化回復(fù),那么用戶(hù)怎么提煉到直播間主播聊天過(guò)程中的具體聊天場(chǎng)景?這是一個(gè)亟待解決的問(wèn)題。
發(fā)明內(nèi)容
本申請(qǐng)實(shí)施例提供了一種會(huì)話場(chǎng)景文本挖掘的方法及計(jì)算裝置,用于通過(guò)無(wú)監(jiān)督的聚類(lèi)方法,可以從直播間的大量彈幕文本中,提煉出K個(gè)會(huì)話場(chǎng)景,并將這些彈幕文本分類(lèi)至K個(gè)會(huì)話場(chǎng)景中,為機(jī)器人提供針對(duì)場(chǎng)景的會(huì)話答復(fù),使得機(jī)器人的功能更加智能化,提高了用戶(hù)體驗(yàn)。
有鑒于此,本申請(qǐng)實(shí)施例第一方面提供了一種會(huì)話場(chǎng)景文本挖掘的方法,所述方法應(yīng)用于大數(shù)據(jù)系統(tǒng),所述大數(shù)據(jù)系統(tǒng)包括k個(gè)場(chǎng)景,N個(gè)文本,最大的迭代次數(shù)num,Nk,k為大于2的正整數(shù),可以包括:
根據(jù)文本距離計(jì)算公式計(jì)算所述N個(gè)文本中任意兩個(gè)文本之間的距離d(ti,tj),其中,ti表示第i個(gè)文本,tj表示第j個(gè)文本;
選擇所述任意兩個(gè)文本之間的距離中最大距離對(duì)應(yīng)的兩個(gè)文本t1和t2,其中,所述t1為第一簇中心點(diǎn),所述t2為第二簇中心點(diǎn);
當(dāng)簇中心點(diǎn)的個(gè)數(shù)為k為2時(shí),根據(jù)所述文本距離計(jì)算公式,將N-k個(gè)文本分配到k個(gè)簇集合中,所述k個(gè)簇集合包括所述第一簇中心點(diǎn)和所述第二簇中心點(diǎn),且同一個(gè)簇集合中包括所述第一簇中心點(diǎn)或所述第二簇中心點(diǎn)中的任意一個(gè);
根據(jù)中心點(diǎn)最優(yōu)函數(shù)計(jì)算每個(gè)簇集合中的新中心點(diǎn);
在每個(gè)簇集合中,選取所述新中心點(diǎn);
根據(jù)標(biāo)準(zhǔn)測(cè)度函數(shù)公式計(jì)算第一次分配的分配誤差Gi和第二次分配的分配誤差Gj;
當(dāng)|Gi-Gj|≤ε時(shí),停止迭代,其中,ε為所有簇集合中心點(diǎn)與簇集合內(nèi)每個(gè)點(diǎn)的距離之和。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于武漢斗魚(yú)網(wǎng)絡(luò)科技有限公司,未經(jīng)武漢斗魚(yú)網(wǎng)絡(luò)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811208617.7/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 上一篇:一種帶壓花圖案的抗裂肌理夾芯及其制作方法
- 下一篇:裝飾組件
- 一種會(huì)話轉(zhuǎn)換的方法及裝置
- 一種人工智能應(yīng)答系統(tǒng)的測(cè)試方法及系統(tǒng)
- 一種會(huì)話處理的方法及服務(wù)器
- 會(huì)話請(qǐng)求發(fā)送方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 提供自適應(yīng)會(huì)話系統(tǒng)的計(jì)算機(jī)實(shí)現(xiàn)方法和自適應(yīng)會(huì)話系統(tǒng)
- 一種網(wǎng)絡(luò)通信會(huì)話聚合的方法
- 會(huì)話處理方法、裝置、電子設(shè)備
- 用于會(huì)話重建或共享的方法、裝置及系統(tǒng)
- 用于輔助實(shí)現(xiàn)會(huì)話的方法、裝置、介質(zhì)以及電子設(shè)備
- 會(huì)話展示方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 電視場(chǎng)景切換的方法及電視
- 視頻場(chǎng)景控制系統(tǒng)及方法
- 場(chǎng)景開(kāi)關(guān)及其場(chǎng)景開(kāi)關(guān)構(gòu)件和場(chǎng)景圖標(biāo)卡組件
- 場(chǎng)景聯(lián)動(dòng)方法及場(chǎng)景聯(lián)動(dòng)系統(tǒng)
- 一種視頻場(chǎng)景分類(lèi)方法、裝置、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 一種Unity3D引擎的場(chǎng)景切換方法和系統(tǒng)
- 一種自動(dòng)駕駛場(chǎng)景分類(lèi)識(shí)別系統(tǒng)及方法
- 一種虛擬場(chǎng)景生成方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 一種汽車(chē)圖像場(chǎng)景庫(kù)數(shù)據(jù)復(fù)雜度度量方法
- 場(chǎng)景識(shí)別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識(shí)別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級(jí)連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計(jì)算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 文本生成方法、裝置和電子設(shè)備





