[發(fā)明專利]基于人工智能的問答文本匹配方法、裝置、介質(zhì)及電子設(shè)備在審
| 申請?zhí)枺?/td> | 202010046066.X | 申請日: | 2020-01-16 |
| 公開(公告)號: | CN111259647A | 公開(公告)日: | 2020-06-09 |
| 發(fā)明(設(shè)計)人: | 李淵;劉設(shè)偉 | 申請(專利權(quán))人: | 泰康保險集團股份有限公司;泰康在線財產(chǎn)保險股份有限公司 |
| 主分類號: | G06F40/194 | 分類號: | G06F40/194;G06F40/284;G06F40/30;G06F40/247;G06N3/08 |
| 代理公司: | 隆天知識產(chǎn)權(quán)代理有限公司 72003 | 代理人: | 章侃銥;鄭特強 |
| 地址: | 100031 北*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 人工智能 問答 文本 匹配 方法 裝置 介質(zhì) 電子設(shè)備 | ||
本公開提供了一種基于人工智能的問答文本匹配方法,包括:通過深度學(xué)習(xí)模型確定所述當(dāng)前用戶的問題文本的詞向量序列和所述候選問題文本的集合中每個候選問題文本的詞向量序列的語義相似度;通過預(yù)設(shè)公式確定所述當(dāng)前用戶的問題文本與所述候選問題文本的集合中每個候選問題文本的文本相似度;根據(jù)所述語義相似度和所述文本相似度確定所述當(dāng)前用戶的問題文本與所述候選問題文本的集合中每個候選問題文本的綜合相似度;根據(jù)所述當(dāng)前用戶的問題文本與所述候選問題文本的集合中每個候選問題文本的綜合相似度確定與所述當(dāng)前用戶的問題文本匹配的候選答案文本,以此方式向用戶發(fā)送的候選答案文本更加準確。
技術(shù)領(lǐng)域
本發(fā)明涉及自然語言處理技術(shù)領(lǐng)域,具體而言,涉及一種基于人工智能的問答文本匹配方法、裝置、介質(zhì)及電子設(shè)備。
背景技術(shù)
傳統(tǒng)問答系統(tǒng)中的問答文本排序技術(shù)通過計算問題中關(guān)鍵詞的文本相似度來返回正確答案,但是很多時候問題關(guān)鍵詞比較少,但語義又相符時候,這種做法就存在缺陷了。隨著深度學(xué)習(xí)技術(shù)的發(fā)展,其在自然語言處理上等到廣泛應(yīng)用。對文本進行詞向量表示,選擇合適的深度學(xué)習(xí)模型對文本建模成為通用語義理解做法。在問題語義匹配過程中,提取問題文本的淺層語義信息和上下文局部特征信息,并且通過注意力機制等其他計算相互作用手段可以獲取全局特征信息,保證了問答文本的語義匹配準確性。但是,該匹配方式只是考慮了用戶問題文本和候選問題文本的語義特征信息,并沒有考慮用戶問題文本和候選問題文本的本文特征,例如,用戶問題文本和候選問題文本中的詞語之間的關(guān)系。因此,相關(guān)技術(shù)中以問答文本的語義來匹配候選問題的準確性較低。
需要說明的是,在上述背景技術(shù)部分公開的信息僅用于加強對本發(fā)明的背景的理解,因此可以包括不構(gòu)成對本領(lǐng)域普通技術(shù)人員已知的現(xiàn)有技術(shù)的信息。
發(fā)明內(nèi)容
本發(fā)明實施例的目的在于提供一種基于人工智能的問答文本匹配方法、裝置、介質(zhì)及電子設(shè)備,進而至少可以在一定程度上克服問答文本匹配時的準確性較低的問題。
本發(fā)明的其他特性和優(yōu)點將通過下面的詳細描述變得顯然,或部分地通過本發(fā)明的實踐而習(xí)得。
根據(jù)本發(fā)明實施例的第一方面,一種基于人工智能的問答文本匹配方法,包括:基于當(dāng)前用戶的問題文本檢索出候選問題文本的集合;對所述當(dāng)前用戶的問題文本和所述候選問題文本的集合中每個候選問題文本分別進行分布式表示,得到所述當(dāng)前用戶的問題文本的詞向量序列和所述候選問題文本的集合中每個候選問題文本的詞向量序列;通過深度學(xué)習(xí)模型確定所述當(dāng)前用戶的問題文本的詞向量序列和所述候選問題文本的集合中每個候選問題文本的詞向量序列的語義相似度;通過預(yù)設(shè)公式確定所述當(dāng)前用戶的問題文本與所述候選問題文本的集合中每個候選問題文本的文本相似度;根據(jù)所述語義相似度和所述文本相似度確定所述當(dāng)前用戶的問題文本與所述候選問題文本的集合中每個候選問題文本的綜合相似度;根據(jù)所述當(dāng)前用戶的問題文本與所述候選問題文本的集合中每個候選問題文本的綜合相似度確定與所述當(dāng)前用戶的問題文本匹配的候選答案文本。
在本發(fā)明的一些實施例中,所述深度學(xué)習(xí)模型是基于預(yù)設(shè)領(lǐng)域的問題文本通過遷移學(xué)習(xí)對預(yù)訓(xùn)練模型進行調(diào)整得到的。
在本發(fā)明的一些實施例中,在基于當(dāng)前用戶的問題文本檢索出候選問題文本的集合之前,該方法還包括:獲取通用領(lǐng)域的問題文本,所述通用領(lǐng)域的問題文本中不包含所述預(yù)設(shè)領(lǐng)域的問題文本;對所述通用領(lǐng)域的問題文本中的每個問題本進行分布式表示,得到所述通用領(lǐng)域的問題文本中的每個問題文本的詞向量序列;通過循環(huán)神經(jīng)網(wǎng)絡(luò)對每個問題文本的詞向量序列進行預(yù)訓(xùn)練,得到所述預(yù)訓(xùn)練模型。
在本發(fā)明的一些實施例中,在得到所述預(yù)訓(xùn)練模型之后,該方法還包括:獲取所述預(yù)設(shè)領(lǐng)域的問題文本;對所述預(yù)設(shè)領(lǐng)域的問題文本中的每個問題本進行分布式表示,得到所述預(yù)設(shè)領(lǐng)域的問題文本中的每個問題文本的詞向量序列;基于所述預(yù)設(shè)領(lǐng)域的問題文本中的每個問題文本的詞向量序列通過所述遷移學(xué)習(xí)對預(yù)訓(xùn)練模型進行調(diào)整,得到所述深度學(xué)習(xí)模型。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于泰康保險集團股份有限公司;泰康在線財產(chǎn)保險股份有限公司,未經(jīng)泰康保險集團股份有限公司;泰康在線財產(chǎn)保險股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010046066.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 使用基于云端的度量迭代訓(xùn)練人工智能的系統(tǒng)
- 一種人工智能轉(zhuǎn)人工智能再轉(zhuǎn)人工方案
- O-RAN系統(tǒng)中的人工智能模型處理方法和裝置
- 人工智能傷口評估方法及智能終端
- 人工智能倫理風(fēng)險與防范虛擬仿真方法、系統(tǒng)和機器人
- 一種基于人工智能基礎(chǔ)資源與技術(shù)調(diào)控系統(tǒng)及方法
- 基于人工智能倫理備選規(guī)則的人工智能倫理風(fēng)險防范方法
- 人工智能倫理風(fēng)險辨識防范虛擬仿真實驗方法和機器人
- 基于人工智能體決策的人工智能倫理風(fēng)險辨識和防范方法
- 基于算法選擇的人工智能倫理風(fēng)險辨識防范方法和機器人





