[發(fā)明專利]語句選取方法、語句顯示方法、相關(guān)裝置及計算設(shè)備有效
| 申請?zhí)枺?/td> | 201811525230.4 | 申請日: | 2018-12-13 |
| 公開(公告)號: | CN111324723B | 公開(公告)日: | 2023-04-25 |
| 發(fā)明(設(shè)計)人: | 宛言 | 申請(專利權(quán))人: | 阿里巴巴集團(tuán)控股有限公司 |
| 主分類號: | G06F16/335 | 分類號: | G06F16/335;G06F40/289 |
| 代理公司: | 北京成創(chuàng)同維知識產(chǎn)權(quán)代理有限公司 11449 | 代理人: | 劉靜 |
| 地址: | 開曼群島大開曼*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語句 選取 方法 顯示 相關(guān) 裝置 計算 設(shè)備 | ||
本發(fā)明公開了一種語句選取方法、語句顯示方法、相關(guān)裝置、計算設(shè)備及介質(zhì),語句選取方法包括:基于語句集合中的各語句,以及語句包括的一個或多個詞,構(gòu)建語句集合對應(yīng)的流向圖模型,流向圖模型包括多個與語句一一對應(yīng)的語句節(jié)點,以及多個與詞一一對應(yīng)的詞節(jié)點;根據(jù)預(yù)設(shè)的容量條件,求解流向圖模型的最大流,以獲取流向圖模型中流入各語句節(jié)點的歸一化流量;選取歸一化流量大于預(yù)設(shè)流量閾值的語句節(jié)點對應(yīng)的語句,作為語句集合的代表語句。
技術(shù)領(lǐng)域
本發(fā)明涉及自然語言處理領(lǐng)域,特別涉及一種語句選取方法、語句顯示方法、相關(guān)裝置、計算設(shè)備及介質(zhì)。
背景技術(shù)
隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,越來越多的事情可以通過網(wǎng)絡(luò)來線上完成,比如購物、辦理銀行業(yè)務(wù)、預(yù)約掛號等,給人們的生活帶來了極大便利。通常,當(dāng)我們在網(wǎng)上使用一項線上服務(wù)時,會與提供該線上服務(wù)的客服人員進(jìn)行信息溝通,特別是對服務(wù)內(nèi)容并不熟悉時。
在用戶與客服人員進(jìn)行溝通的場景下,很大概率會出現(xiàn)如下兩種情況:第一種是當(dāng)前客服人員雖是人工客服,但并非所咨詢問題對應(yīng)的專業(yè)客服,此時需要進(jìn)行轉(zhuǎn)接處理,將該用戶轉(zhuǎn)移給合適的人工客服,第二種則是當(dāng)前客服人員是機(jī)器人客服,而用戶咨詢的問題并非機(jī)器人客服所能解答的問題,需要為用戶提供轉(zhuǎn)接人工客服的處理。
在上述兩種情況下,用戶在與當(dāng)前客服人員已經(jīng)進(jìn)行了一定程度上的溝通,將用戶轉(zhuǎn)移時,應(yīng)將之前的溝通內(nèi)容一并轉(zhuǎn)移給新的客服人員。然而,溝通內(nèi)容可能文字?jǐn)?shù)量繁多,且存在多處重復(fù)部分,其一般包括多個語句,若直接交付給新的客服人員,客服人員重新理解溝通內(nèi)容以確定用戶需求會造成時間上的浪費,導(dǎo)致用戶等待時間過長,體驗較差。
為解決上述問題,避免重復(fù)內(nèi)容對溝通效率帶來的不良影響,目前多采用傳統(tǒng)的Word2vec相似度計算方法,對溝通內(nèi)容中的多個語句,利用詞向量生成稠密向量代表詞的維度,加和平均計算出語句的向量,再利用余弦距離計算出語句之間的相似度,以達(dá)到去重的效果。但是,這一方法中加和平均的向量并不能很好地表示語句的意思,且只能計算出語句之間的相似度,卻不能從溝通內(nèi)容中選出具有代表性的語句,來言簡意賅地表述清楚用戶的真實想法。而且,即使采用如上去重方式來對代表性的語句進(jìn)行選取,并向新的客服人員轉(zhuǎn)發(fā)溝通內(nèi)容,但在顯示溝通內(nèi)容時,并未對已選出的代表性語句進(jìn)行強(qiáng)調(diào)顯示等相應(yīng)處理,以便該客服人員快速知曉溝通內(nèi)容的重點。因此,需要提供一種新的語句選取和顯示方案,以優(yōu)化以上處理過程。
發(fā)明內(nèi)容
為此,本發(fā)明提供一種語句選取及顯示方案,以力圖解決或者至少緩解上面存在的問題。
根據(jù)本發(fā)明的一個方面,提供一種語句選取方法,該方法包括如下步驟:首先,基于語句集合中的各語句,以及語句包括的一個或多個詞,構(gòu)建語句集合對應(yīng)的流向圖模型,流向圖模型包括多個與語句一一對應(yīng)的語句節(jié)點,以及多個與詞一一對應(yīng)的詞節(jié)點;根據(jù)預(yù)設(shè)的容量條件,求解流向圖模型的最大流,以獲取流向圖模型中流入各語句節(jié)點的歸一化流量;選取歸一化流量大于預(yù)設(shè)流量閾值的語句節(jié)點對應(yīng)的語句,作為語句集合的代表語句。
可選地,在根據(jù)本發(fā)明的語句選取方法中,基于語句集合中的各語句,以及語句包括的一個或多個詞,構(gòu)建語句集合對應(yīng)的流向圖模型包括:根據(jù)各語句與各詞之間的對應(yīng)關(guān)系,建立從各語句對應(yīng)的語句節(jié)點到各詞對應(yīng)的詞節(jié)點的映射;添加源節(jié)點和匯節(jié)點,并以源節(jié)點為起始點,以匯節(jié)點為終點,建立源節(jié)點至各語句節(jié)點的映射,以及各詞節(jié)點至匯節(jié)點的映射。
可選地,在根據(jù)本發(fā)明的語句選取方法中,預(yù)設(shè)的容量條件包括:流入任一語句節(jié)點的流量,不超過語句節(jié)點對應(yīng)的語句所包括詞的數(shù)量;流入和流出任一詞節(jié)點的流量,均不超過1。
可選地,在根據(jù)本發(fā)明的語句選取方法中,求解流向圖模型的最大流包括:通過Ford-Fulkerson算法,求解流向圖模型的最大流。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于阿里巴巴集團(tuán)控股有限公司,未經(jīng)阿里巴巴集團(tuán)控股有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811525230.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 基于聊天大數(shù)據(jù)知識庫的機(jī)器人對話控制方法和系統(tǒng)
- 基于大數(shù)據(jù)搜索的幽默型機(jī)器人對話控制方法和系統(tǒng)
- 基于對話知識庫的機(jī)器人對話控制方法和系統(tǒng)
- 一種自然語言語句評價方法及裝置
- 句子級雙語對齊方法及系統(tǒng)
- 一種獲取相似語句的方法、裝置、存儲介質(zhì)及電子設(shè)備
- 一種翻譯模型結(jié)果重排序的方法及裝置
- 用于輸出信息的方法、裝置、設(shè)備以及存儲介質(zhì)
- 搜索推薦方法和裝置、服務(wù)器、計算機(jī)可讀存儲介質(zhì)
- 文本識別方法、裝置、電子設(shè)備和可讀存儲介質(zhì)





