[發(fā)明專利]一種節(jié)點文本融合方法、裝置、計算機設(shè)備及存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202110705528.9 | 申請日: | 2021-06-24 |
| 公開(公告)號: | CN113420161A | 公開(公告)日: | 2021-09-21 |
| 發(fā)明(設(shè)計)人: | 孫梓淇;白祚;莫洋 | 申請(專利權(quán))人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F40/30;G06K9/62 |
| 代理公司: | 深圳市世聯(lián)合知識產(chǎn)權(quán)代理有限公司 44385 | 代理人: | 汪琳琳 |
| 地址: | 518000 廣東省深圳市福田區(qū)福*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 節(jié)點 文本 融合 方法 裝置 計算機 設(shè)備 存儲 介質(zhì) | ||
1.一種基于圖傳播算法的節(jié)點文本融合方法,其特征在于,包括下述步驟:
接收用戶終端發(fā)送的攜帶有待處理節(jié)點文本的節(jié)點融合請求;
根據(jù)訓練好的語言模型對所述待處理節(jié)點文本進行語義表示操作,得到節(jié)點語義向量;
根據(jù)所述節(jié)點語義向量計算所述每兩個待處理節(jié)點文本之間的文本相似度;
對所述文本相似度大于所述關(guān)聯(lián)閾值的所述待處理節(jié)點文本建立關(guān)聯(lián)關(guān)系,得到節(jié)點數(shù)據(jù)集合;
根據(jù)所述節(jié)點數(shù)據(jù)集合構(gòu)建與所述待處理節(jié)點文本相對應的原始知識圖譜;
根據(jù)圖傳播算法對所述原始知識圖譜進行篩選操作,得到同標簽節(jié)點數(shù)據(jù);
根據(jù)預設(shè)的主節(jié)點確認策略在所述同標簽節(jié)點數(shù)據(jù)中確認主節(jié)點概念以及融合節(jié)點概念,得到語義融合后的節(jié)點數(shù)據(jù)集合。
2.根據(jù)權(quán)利要求1所述的基于圖傳播算法的節(jié)點文本融合方法,其特征在于,在所述根據(jù)所述節(jié)點語義向量計算所述每兩個待處理節(jié)點文本之間的文本相似度的步驟之前,還包括下述步驟:
采用MiniBatch KMeans算法對所述待處理節(jié)點文本進行分解操作,得到若干原始概念簇類;
所述根據(jù)所述節(jié)點語義向量計算所述每兩個待處理節(jié)點文本之間的文本相似度的步驟,具體包括下述步驟:
在同一所述原始概念簇類中根據(jù)所述節(jié)點語義向量計算所述每兩個待處理節(jié)點文本之間的所述文本相似度。
3.根據(jù)權(quán)利要求1所述的基于圖傳播算法的節(jié)點文本融合方法,其特征在于,所述文本相似度表示為:
其中,X、Y表示所述待處理節(jié)點文本;Dist(X,Y)為待處理節(jié)點文本X和待處理節(jié)點文本Y之間的相似度;xi表示在待處理節(jié)點文本X中的第i個節(jié)點語義向量,且i∈(1,n);y_max(xi)表示為在待處理節(jié)點文本Y中與節(jié)點語義向量xi的相似度最高的節(jié)點語義向量;dist(xi,y_max(xi)表示節(jié)點語義向量xi與節(jié)點語義向量y_max(xi)的詞向量距離。
4.根據(jù)權(quán)利要求3所述的基于圖傳播算法的節(jié)點文本融合方法,其特征在于,所述文本相似度還表示為:
其中,α表示自定義的放大系數(shù),c表示概念X和概念Y相同的文本,len()表示文本長度。
5.根據(jù)權(quán)利要求1所述的基于圖傳播算法的節(jié)點文本融合方法,其特征在于,所述根據(jù)所述節(jié)點語義向量計算所述每兩個待處理節(jié)點文本之間的文本相似度的步驟,具體包括:
判斷所述每兩個待處理節(jié)點文本中是否存在相同文本;
若所述每兩個待處理節(jié)點文本中不存在相同文本,則基于所述文本相似度表達公式計算所述文本相似度;
若所述每兩個待處理節(jié)點文本中存在相同文本,則根據(jù)增大規(guī)則增大所述放大系數(shù)α,并基于增大的所述文本相似度表達公式計算所述文本相似度。
6.根據(jù)權(quán)利要求5所述的基于圖傳播算法的節(jié)點文本融合方法,其特征在于,在所述根據(jù)預設(shè)的主節(jié)點確認策略在所述同標簽節(jié)點數(shù)據(jù)中確認主節(jié)點概念以及融合節(jié)點概念,得到語義融合后的節(jié)點數(shù)據(jù)集合的步驟之后還包括:
將所述待處理節(jié)點文本以及所述節(jié)點數(shù)據(jù)集合存儲至區(qū)塊鏈中。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于平安科技(深圳)有限公司,未經(jīng)平安科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110705528.9/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 節(jié)點查詢方法、節(jié)點、移動通訊系統(tǒng)和計算機程序產(chǎn)品
- 一種根據(jù)節(jié)點集合構(gòu)造節(jié)點關(guān)系樹的方法、裝置及系統(tǒng)
- 一種DHT網(wǎng)絡(luò)負載均衡裝置及虛節(jié)點劃分的方法
- 一種無線傳感網(wǎng)地理位置路由空洞處理方法
- 節(jié)點鎖定部件、節(jié)點滑軌、節(jié)點和機箱
- 一種待推薦節(jié)點線路的確定方法及裝置
- 流控方法、目標節(jié)點、節(jié)點及施主節(jié)點
- 節(jié)點布局確定方法以及裝置
- 一種具有分布式柔度的全柔順微位移放大機構(gòu)
- 節(jié)點掛載方法、裝置、網(wǎng)絡(luò)節(jié)點及存儲介質(zhì)





