[發(fā)明專利]文本匹配方法、裝置和電子設(shè)備有效
| 申請?zhí)枺?/td> | 202010533381.5 | 申請日: | 2020-06-12 |
| 公開(公告)號: | CN111444319B | 公開(公告)日: | 2020-10-20 |
| 發(fā)明(設(shè)計)人: | 陳曉軍;陳顯玲;楊明暉;潘寅旭 | 申請(專利權(quán))人: | 支付寶(杭州)信息技術(shù)有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/35;G06F40/216;G06F40/194;G06F40/126;G06F40/284;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京匯思誠業(yè)知識產(chǎn)權(quán)代理有限公司 11444 | 代理人: | 馮偉 |
| 地址: | 310007 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 文本 匹配 方法 裝置 電子設(shè)備 | ||
本說明書提出了一種文本匹配方法、裝置和電子設(shè)備,其中,上述方法包括:獲取待匹配文本,根據(jù)所述待匹配文本得到知識點集合;根據(jù)所述知識點集合中的每個知識點進行查詢,得到與每個所述知識點對應(yīng)的一個或多個擴展信息;依次將每個所述知識點對應(yīng)的擴展信息與所述待匹配文本進行計算,得到相似度集合;根據(jù)所述相似度集合與所述知識點集合確定與所述待匹配文本匹配的知識點。通過上述方法可以提高輸入文本與知識點之間的匹配的準(zhǔn)確度。
技術(shù)領(lǐng)域
本說明書涉及人工智能領(lǐng)域,尤其涉及一種文本匹配方法、裝置和電子設(shè)備。
背景技術(shù)
人工智能(Artificial Intelligence;以下簡稱:AI),是目前研究和開發(fā)用于模擬、延伸以及擴展人類智能的一門新興科學(xué)技術(shù)。其中,AI的主要研究目標(biāo)是使機器能夠勝任一些通常需要人類智能才能完成的復(fù)雜工作;在實踐應(yīng)用中,通常是構(gòu)建一個模型,例如,構(gòu)建一個分類模型,通過訓(xùn)練數(shù)據(jù)對該分類模型進行反復(fù)訓(xùn)練,當(dāng)訓(xùn)練到期望的目標(biāo)時,可將該分類模型用于分類。
發(fā)明內(nèi)容
本說明書實施例提供了一種文本匹配方法、裝置和電子設(shè)備,通過獲取待匹配文本對應(yīng)的知識點的擴展信息,根據(jù)該擴展信息與待匹配文本之間的相似度確定匹配的知識點,可以提高輸入文本與知識點之間的匹配的準(zhǔn)確度。
第一方面,本說明書實施例提供一種文本匹配方法,包括:
獲取待匹配文本,根據(jù)所述待匹配文本得到知識點集合,其中,所述知識點集合包括多個知識點;
根據(jù)所述知識點集合中的每個知識點進行查詢,得到與每個所述知識點對應(yīng)的一個或多個擴展信息;依次將每個所述知識點對應(yīng)的擴展信息與所述待匹配文本進行計算,得到相似度集合,其中,所述相似度集合包括每個所述知識點與所述待匹配文本之間的相似度;
根據(jù)所述相似度集合與所述知識點集合確定與所述待匹配文本匹配的知識點。
其中一種可能的實現(xiàn)方式中,所述根據(jù)所述待匹配文本得到知識點集合包括:
將所述待匹配文本輸入至預(yù)置分類模型,得到與所述待匹配文本對應(yīng)的多個分類,其中,每個所述分類對應(yīng)一個知識點及預(yù)測概率;
依次將每個所述知識點的預(yù)測概率與預(yù)置概率閾值進行比較,得到大于所述預(yù)置概率閾值的知識點。
其中一種可能的實現(xiàn)方式中,所述依次將每個所述知識點對應(yīng)的擴展信息與所述待匹配文本進行計算,得到相似度集合包括:
將所述擴展信息與所述待匹配文本分別輸入至預(yù)置向量轉(zhuǎn)換模型,得到擴展信息向量及待匹配文本向量;
依次將每個所述知識點對應(yīng)的擴展信息向量與所述待匹配文本向量進行計算,得到相似度集合。
其中一種可能的實現(xiàn)方式中,所述依次將每個所述知識點對應(yīng)的擴展信息向量與所述待匹配文本向量進行計算,得到相似度集合包括:
根據(jù)每個所述知識點對應(yīng)的多個擴展信息向量確定擴展信息均值向量,其中,所述擴展信息均值向量用于表征多個擴展信息向量的平均值;
依次將每個所述知識點對應(yīng)的擴展信息均值向量與所述待匹配文本向量進行計算,得到相似度集合。
其中一種可能的實現(xiàn)方式中,所述根據(jù)所述相似度集合與所述知識點集合確定與所述待匹配文本匹配的知識點包括:
根據(jù)所述知識點集合中每個所述知識點的預(yù)測概率與所述相似度集合中對應(yīng)的相似度的和值對所述知識點進行排序;
根據(jù)所述順序確定與所述待匹配文本匹配的知識點。
第二方面,本說明書實施例提供一種文本匹配裝置,包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于支付寶(杭州)信息技術(shù)有限公司,未經(jīng)支付寶(杭州)信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010533381.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





