[發(fā)明專(zhuān)利]用于文本處理的方法和裝置在審
| 申請(qǐng)?zhí)枺?/td> | 202010127184.3 | 申請(qǐng)日: | 2020-02-28 |
| 公開(kāi)(公告)號(hào): | CN111339256A | 公開(kāi)(公告)日: | 2020-06-26 |
| 發(fā)明(設(shè)計(jì))人: | 彭爽;崔恒斌 | 申請(qǐng)(專(zhuān)利權(quán))人: | 支付寶(杭州)信息技術(shù)有限公司 |
| 主分類(lèi)號(hào): | G06F16/33 | 分類(lèi)號(hào): | G06F16/33;G06F16/332;G06F40/211;G06N3/04;G06N3/08 |
| 代理公司: | 北京永新同創(chuàng)知識(shí)產(chǎn)權(quán)代理有限公司 11376 | 代理人: | 楊錫勱;趙磊 |
| 地址: | 310000 浙江省杭州市*** | 國(guó)省代碼: | 浙江;33 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 文本 處理 方法 裝置 | ||
本說(shuō)明書(shū)的實(shí)施例提供了用于文本處理的方法、裝置、計(jì)算設(shè)備和機(jī)器可讀存儲(chǔ)介質(zhì)。該方法包括:接收第一文本向量和第二文本向量,其中,第一文本向量用于表示用戶問(wèn)句文本,第二文本向量用于表示候選問(wèn)句文本,候選問(wèn)句文本是從知識(shí)庫(kù)中獲取的;利用RNN和CNN,對(duì)第一文本向量和第二文本向量進(jìn)行編碼,得到針對(duì)第一文本向量的第一編碼結(jié)果和針對(duì)第二文本向量的第二編碼結(jié)果;基于第一編碼結(jié)果和第二編碼結(jié)果,確定用戶問(wèn)句文本與候選問(wèn)句文本之間的相似度,其中,相似度用于確定針對(duì)用戶問(wèn)句文本的答復(fù)。
技術(shù)領(lǐng)域
本說(shuō)明書(shū)的實(shí)施例涉及信息技術(shù)領(lǐng)域,更具體地,涉及用于文本處理的方法、裝置、計(jì)算設(shè)備和機(jī)器可讀存儲(chǔ)介質(zhì)。
背景技術(shù)
隨著機(jī)器學(xué)習(xí)等各種技術(shù)的不斷發(fā)展,為了方便用戶獲得幫助,已經(jīng)開(kāi)發(fā)了智能問(wèn)答系統(tǒng)。智能問(wèn)答系統(tǒng)可以實(shí)現(xiàn)人機(jī)對(duì)話,例如,用戶向智能問(wèn)答系統(tǒng)提出問(wèn)題,智能問(wèn)答系統(tǒng)能夠自動(dòng)地回答問(wèn)題。可見(jiàn),智能問(wèn)答系統(tǒng)不僅提供了極大的便利性,而且降低了人工回答問(wèn)題的成本。然而,如何使得智能問(wèn)答系統(tǒng)準(zhǔn)確地回答用戶的問(wèn)題,成為需要解決的問(wèn)題之一。
發(fā)明內(nèi)容
考慮到現(xiàn)有技術(shù)的上述問(wèn)題,本說(shuō)明書(shū)的實(shí)施例提供了用于文本處理的方法、裝置、計(jì)算設(shè)備和機(jī)器可讀存儲(chǔ)介質(zhì)。
一方面,本說(shuō)明書(shū)的實(shí)施例提供了一種用于文本處理的方法,包括:接收第一文本向量和第二文本向量,其中,所述第一文本向量用于表示用戶問(wèn)句文本,所述第二文本向量用于表示候選問(wèn)句文本,所述候選問(wèn)句文本是從知識(shí)庫(kù)中獲取的,所述知識(shí)庫(kù)包括至少一個(gè)現(xiàn)有問(wèn)句文本以及針對(duì)各個(gè)現(xiàn)有問(wèn)句文本的答案文本;利用遞歸神經(jīng)網(wǎng)絡(luò)(RecurrentNeural Network,RNN)和卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN),對(duì)所述第一文本向量和所述第二文本向量進(jìn)行編碼,得到針對(duì)所述第一文本向量的第一編碼結(jié)果和針對(duì)所述第二文本向量的第二編碼結(jié)果;基于所述第一編碼結(jié)果和所述第二編碼結(jié)果,確定所述用戶問(wèn)句文本與所述候選問(wèn)句文本之間的相似度,其中,所述相似度用于確定針對(duì)所述用戶問(wèn)句文本的答復(fù)。
另一方面,本說(shuō)明書(shū)的實(shí)施例提供了一種用于文本處理的裝置,包括:接收單元,其接收第一文本向量和第二文本向量,其中,所述第一文本向量用于表示用戶問(wèn)句文本,所述第二文本向量用于表示候選問(wèn)句文本,所述候選問(wèn)句文本是從知識(shí)庫(kù)中獲取的,所述知識(shí)庫(kù)包括至少一個(gè)現(xiàn)有問(wèn)句文本以及針對(duì)各個(gè)現(xiàn)有問(wèn)句文本的答案文本;編碼單元,其利用RNN和CNN,對(duì)所述第一文本向量和所述第二文本向量進(jìn)行編碼,得到針對(duì)所述第一文本向量的第一編碼結(jié)果和針對(duì)所述第二文本向量的第二編碼結(jié)果;確定單元,其基于所述第一編碼結(jié)果和所述第二編碼結(jié)果,確定所述用戶問(wèn)句文本與所述候選問(wèn)句文本之間的相似度,其中,所述相似度用于確定針對(duì)所述用戶問(wèn)句文本的答復(fù)。
另一方面,本說(shuō)明書(shū)的實(shí)施例提供了一種計(jì)算設(shè)備,包括:至少一個(gè)處理器;與所述至少一個(gè)處理器進(jìn)行通信的存儲(chǔ)器,其上存儲(chǔ)有可執(zhí)行代碼,所述可執(zhí)行代碼在被所述至少一個(gè)處理器執(zhí)行時(shí)使得所述至少一個(gè)處理器實(shí)現(xiàn)上述方法。
另一方面,本說(shuō)明書(shū)的實(shí)施例提供了一種機(jī)器可讀存儲(chǔ)介質(zhì),其存儲(chǔ)有可執(zhí)行代碼,所述可執(zhí)行代碼在被執(zhí)行時(shí)使得機(jī)器執(zhí)行上述方法。
附圖說(shuō)明
通過(guò)結(jié)合附圖對(duì)本說(shuō)明書(shū)的實(shí)施例的更詳細(xì)的描述,本說(shuō)明書(shū)的實(shí)施例的上述以及其它目的、特征和優(yōu)勢(shì)將變得更加明顯,其中,在本說(shuō)明書(shū)的實(shí)施例中,相同的附圖標(biāo)記通常代表相同的元素。
圖1是根據(jù)一個(gè)實(shí)施例的智能問(wèn)答系統(tǒng)的運(yùn)行過(guò)程的示意性流程圖。
圖2是根據(jù)一個(gè)實(shí)施例的用于文本處理的方法的示意性流程圖。
圖3A是根據(jù)一個(gè)實(shí)施例的相似度模型的結(jié)構(gòu)示意圖。
圖3B是根據(jù)一個(gè)實(shí)施例的CNN編碼器的結(jié)構(gòu)示意圖。
圖4是根據(jù)一個(gè)實(shí)施例的用于文本處理的裝置的示意性框圖。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于支付寶(杭州)信息技術(shù)有限公司,未經(jīng)支付寶(杭州)信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010127184.3/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識(shí)別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級(jí)連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計(jì)算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 文本生成方法、裝置和電子設(shè)備
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





