[發(fā)明專利]合同條款相似度計算方法、裝置、設(shè)備及可讀存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 201910206015.6 | 申請日: | 2019-03-16 |
| 公開(公告)號: | CN110083809A | 公開(公告)日: | 2019-08-02 |
| 發(fā)明(設(shè)計)人: | 田磊;馬皓;王威;胡家義;吳力豐;王昊;鄒永衛(wèi) | 申請(專利權(quán))人: | 平安城市建設(shè)科技(深圳)有限公司 |
| 主分類號: | G06F17/22 | 分類號: | G06F17/22;G06F17/27;G06Q40/00 |
| 代理公司: | 深圳市世紀恒程知識產(chǎn)權(quán)代理事務(wù)所 44287 | 代理人: | 胡海國 |
| 地址: | 518000 廣東省深圳市前海深港合作區(qū)前*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 合同 預(yù)設(shè) 可讀存儲介質(zhì) 相似度計算 句子向量 詞向量 相似度 相似度計算裝置 數(shù)據(jù)處理技術(shù) 潛在威脅 條款修改 匹配 數(shù)據(jù)庫 終端 發(fā)送 | ||
本發(fā)明公開了一種合同條款相似度計算方法,包括:基于詞向量模型對待計算合同條款進行訓(xùn)練;基于匹配句子向量以及詞向量確定所述待計算合同條款對應(yīng)的句子向量;計算待計算合同條款與各個預(yù)設(shè)合同條款之間的相似度;確定待計算合同條款對應(yīng)的目標預(yù)設(shè)合同條款;將目標預(yù)設(shè)合同條款以及目標預(yù)設(shè)合同條款對應(yīng)的相似度發(fā)送至所述待計算合同條款對應(yīng)的終端。本發(fā)明還公開了一種合同條款相似度計算裝置、設(shè)備及可讀存儲介質(zhì)。本發(fā)明通過數(shù)據(jù)處理技術(shù)對合同條款進行處理,能夠準確確定合同條款數(shù)據(jù)庫中與待計算合同條款最相似的條款,以便于用戶根據(jù)該目標預(yù)設(shè)合同條款修改待計算合同條款,從而減少待計算合同條款所導(dǎo)致的潛在威脅和損失。
技術(shù)領(lǐng)域
本發(fā)明涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其涉及一種合同條款相似度計算方法、裝置、設(shè)備及可讀存儲介質(zhì)。
背景技術(shù)
隨著經(jīng)濟社會的飛速發(fā)展,每個人在工作和生活中都不可避免的會接觸合同文本,例如聘用入職、房屋出租、房屋求租、二手房買賣、外出旅游等等。合同的交易對方既包括個人,也包括企業(yè)法人等。合同文本的形式既包括即時手寫合同,也包括交易對方預(yù)先準備好的合同范本。尤其是在面對房屋買賣中介機構(gòu)、旅游服務(wù)公司、房屋租賃中介機構(gòu)等各種機構(gòu)時,由于這些機構(gòu)有意或無意的會在合同范本中隱藏一些對用戶不甚公平的合同條款。面對這些不甚合理的合同文本,大多數(shù)用戶難以全部發(fā)現(xiàn)這些文本中的不合理條款,從而為用戶帶來許多潛在的威脅和損失。
目前,現(xiàn)有的合同分析方案或文獻中,大多關(guān)注于合同條款生成,利用合同模板技術(shù)幫助用戶生成空白合同。并沒有針對合同條款進行識別分析,難以識別出合同條款中的不合理風(fēng)險信息,導(dǎo)致合同條款存在潛在的風(fēng)險
上述內(nèi)容僅用于輔助理解本發(fā)明的技術(shù)方案,并不代表承認上述內(nèi)容是現(xiàn)有技術(shù)。
發(fā)明內(nèi)容
本發(fā)明的主要目的在于提供一種合同條款相似度計算方法、裝置、設(shè)備及可讀存儲介質(zhì),旨在解決難以識別出合同條款中的不合理風(fēng)險信息的技術(shù)問題。
為實現(xiàn)上述目的,本發(fā)明提供一種合同條款相似度計算方法,所述合同條款相似度計算方法包括以下步驟:
基于詞向量模型對待計算合同條款進行訓(xùn)練,以獲得所述待計算合同條款對應(yīng)的詞向量;
基于匹配句子向量以及所述詞向量確定所述待計算合同條款對應(yīng)的句子向量;
基于所述句子向量以及合同條款數(shù)據(jù)庫中各個預(yù)設(shè)合同條款的預(yù)設(shè)句子向量,計算所述待計算合同條款與各個所述預(yù)設(shè)合同條款之間的相似度;
基于所述相似度,在所述合同條款數(shù)據(jù)庫中,確定所述待計算合同條款對應(yīng)的目標預(yù)設(shè)合同條款;
將所述目標預(yù)設(shè)合同條款以及所述目標預(yù)設(shè)合同條款對應(yīng)的相似度發(fā)送至所述待計算合同條款對應(yīng)的終端。
進一步地,所述基于匹配句子向量以及所述詞向量確定所述待計算合同條款對應(yīng)的句子向量的步驟包括:
計算匹配句子向量中的詞向量與所述詞向量之間的相似度,基于所述相似度生成相似詞矩陣,其中,所述相似詞矩陣中的每一行的元素為同一詞向量與匹配句子向量中的詞向量之間的相似度;
基于所述相似詞矩陣的每一列元素中的最大相似度,生成所述句子向量。
進一步地,所述基于所述句子向量以及合同條款數(shù)據(jù)庫中各個預(yù)設(shè)合同條款的預(yù)設(shè)句子向量,計算所述待計算合同條款與各個所述預(yù)設(shè)合同條款之間的相似度的步驟包括:
基于所述待計算合同條款,通過Tf-idf算法,確定各個預(yù)設(shè)合同條款的預(yù)設(shè)句子向量中的目標句子向量;
基于所述句子向量以及目標句子向量,計算所述待計算合同條款,與所述預(yù)設(shè)合同條款中目標句子向量對應(yīng)的目標合同條款之間的相似度。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于平安城市建設(shè)科技(深圳)有限公司,未經(jīng)平安城市建設(shè)科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910206015.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 具有中間反應(yīng)層的有限次播放光學(xué)設(shè)備以及制造該設(shè)備的方法
- 用于有限播放光學(xué)設(shè)備的反應(yīng)性物質(zhì)及其制法
- 存儲裝置和信息處理系統(tǒng)
- 用于興趣點識別的系統(tǒng)和方法
- 網(wǎng)絡(luò)配置方法、配置文件集生成方法、裝置及網(wǎng)絡(luò)設(shè)備
- 電子裝置及其操作方法
- 用于將操作系統(tǒng)存儲在計算機可讀介質(zhì)上的BIOS代碼
- 多存儲介質(zhì)并存的配置方法、裝置和系統(tǒng)
- 相機組同步曝光控制方法及系統(tǒng)、計算機可讀存儲介質(zhì)、相機組控制系統(tǒng)
- 炒鍋翻炒方法、計算機可讀存儲介質(zhì)及智能炒菜機





