[發(fā)明專利]一種文本處理方法及裝置在審

申請?zhí)枺?/td>	201911381802.0	申請日：	2019-12-27
公開（公告）號：	CN111159375A	公開（公告）日：	2020-05-15
發(fā)明（設(shè)計）人：	易劍韜;彭明;鄭少杰;楊波;范增虎;江旻	申請（專利權(quán)）人：	深圳前海微眾銀行股份有限公司
主分類號：	G06F16/332	分類號：	G06F16/332;G06F16/35;G06F40/30
代理公司：	北京同達信恒知識產(chǎn)權(quán)代理有限公司 11291	代理人：	侯林林
地址：	518027 廣東省深圳市***	國省代碼：	廣東;44
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	一種文本處理方法裝置
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

本發(fā)明公開了一種文本處理方法及裝置，其中方法為：獲取用戶對話文本；所述用戶對話文本為整通對話文本中的一輪對話文本；對所述用戶對話文本進行語義分析，提取所述用戶對話文本中蘊含的至少一個意圖；根據(jù)所述至少一個意圖和時序多意圖矩陣中記錄的意圖，確定響應(yīng)所述用戶對話文本的回答文本；所述時序多意圖矩陣用于記錄所述整通對話文本中在所述用戶對話文本之前已獲取到的多個意圖。上述方法應(yīng)用于金融科技(Fintech)時，能夠聯(lián)系用戶對話的歷史意圖一同響應(yīng)所述用戶對話文本的回答文本，從而可以更全面、準確地響應(yīng)用戶地需求。

技術(shù)領(lǐng)域

本發(fā)明涉及金融科技(Fintech)領(lǐng)域和人工智能領(lǐng)域，尤其涉及一種文本處理方法及裝置。

背景技術(shù)

隨著計算機技術(shù)的發(fā)展，越來越多的技術(shù)應(yīng)用在金融領(lǐng)域，傳統(tǒng)金融業(yè)正在逐步向金融科技(Fintech)轉(zhuǎn)變，但由于金融行業(yè)的安全性、實時性要求，也對技術(shù)提出的更高的要求。目前金融機構(gòu)常通過機器人與用戶進行智能對話，以代替人工交流。

目前的方法中，在整通通話中，只能對每一次用戶的會話簡單地分析出一個意圖，再根據(jù)這個意圖配置的話術(shù)模板去回應(yīng)用戶。而語言是復(fù)雜的，所表達的語義也是多種多樣，同樣的一句話在不同語境下的含義也不盡相同。僅根據(jù)一個單句的意圖去響應(yīng)用戶的會話，難以全面、準確地響應(yīng)用戶的需求，這樣配置的話術(shù)模板與流程就顯得差強人意，甚至反復(fù)追問用戶，造成較差的用戶體驗。

發(fā)明內(nèi)容

本申請實施例提供一種文本處理方法及裝置，解決了現(xiàn)有技術(shù)中智能對話難以全面、準確地響應(yīng)用戶的需求的問題。

第一方面，本申請實施例提供一種文本處理方法，包括：獲取用戶對話文本；所述用戶對話文本為整通對話文本中的一輪對話文本；對所述用戶對話文本進行語義分析，提取所述用戶對話文本中蘊含的至少一個意圖；根據(jù)所述至少一個意圖和時序多意圖矩陣中記錄的意圖，確定響應(yīng)所述用戶對話文本的回答文本；所述時序多意圖矩陣用于記錄所述整通對話文本中在所述用戶對話文本之前已獲取到的多個意圖。

上述方法中，獲取了用戶對話文本后，首先提取所述用戶對話文本中蘊含的至少一個意圖，根據(jù)所述至少一個意圖結(jié)合時序多意圖矩陣中記錄的意圖，確定響應(yīng)所述用戶對話文本的回答文本，能夠聯(lián)系用戶對話的歷史意圖一同響應(yīng)所述用戶對話文本的回答文本，從而可以更全面、準確地響應(yīng)用戶地需求。

可選地，所述對所述用戶對話文本進行語義分析，提取所述用戶對話文本中蘊含的至少一個意圖，包括：獲取多個語義文本；所述多個語義文本中每個語義文本都對應(yīng)一個意圖；確定所述多個語義文本中與所述用戶對話文本的語義相似度，從而對所述用戶對話文本進行語義分析；將所述多個語義文本中與所述用戶對話文本語義相似度最高的N個語義文本對應(yīng)的意圖，作為所述至少一個意圖中的意圖；N為正整數(shù)；和\或?qū)⑺鲇脩魧υ捨谋据斎胛谋痉诸惸Ｐ停鶕?jù)所述用戶對話文本中各詞語的語義，確定所述用戶對話文本在所述文本分類模型的各意圖中所對應(yīng)的意圖，從而對所述用戶對話文本進行語義分析；并將所述用戶對話文本在所述各意圖中所對應(yīng)的意圖作為所述至少一個意圖中的意圖；所述文本分類模型是根據(jù)標注了意圖的文本數(shù)據(jù)訓(xùn)練得到的。

上述方法中，提供了兩個角度下對用戶對話文本進行語義分析的方法，一是獲取多個語義文本后，根據(jù)語義相似度，將所述多個語義文本中與所述用戶對話文本語義相似度最高的N個語義文本對應(yīng)的意圖，作為所述至少一個意圖中的意圖，二是通過將所述用戶對話文本輸入文本分類模型，根據(jù)所述用戶對話文本中各詞語的語義，確定所述用戶對話文本在所述文本分類模型的各意圖中所對應(yīng)的意圖，對所述用戶對話文本進行語義分析，兩個角度結(jié)合，可以更精確更全面地提取出用戶對話文本中蘊含的意圖。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳前海微眾銀行股份有限公司，未經(jīng)深圳前海微眾銀行股份有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201911381802.0/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

同類專利

專利分類

G 物理

G06 計算；推算；計數(shù)
G06F 電數(shù)字數(shù)據(jù)處理

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】