[發(fā)明專利]語句等價(jià)性判斷方法和裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201910832807.4 | 申請(qǐng)日: | 2019-09-04 |
| 公開(公告)號(hào): | CN110633359B | 公開(公告)日: | 2022-03-29 |
| 發(fā)明(設(shè)計(jì))人: | 王然;蘇海波;孫偉;劉鈺;杜曉夢(mèng);劉譯璟 | 申請(qǐng)(專利權(quán))人: | 北京百分點(diǎn)科技集團(tuán)股份有限公司 |
| 主分類號(hào): | G06F16/332 | 分類號(hào): | G06F16/332;G06F40/211;G06N3/04 |
| 代理公司: | 北京國昊天誠知識(shí)產(chǎn)權(quán)代理有限公司 11315 | 代理人: | 許振新 |
| 地址: | 100096 北京市海淀*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語句 等價(jià) 判斷 方法 裝置 | ||
本申請(qǐng)實(shí)施例公開了一種語句等價(jià)性判斷方法和裝置,所述方法包括:獲取待判斷等價(jià)性的語句;將所述語句輸入預(yù)先訓(xùn)練的等價(jià)性判斷模型,所述等價(jià)性判斷模型根據(jù)基于深度學(xué)習(xí)模型和人工特征模型的模型平均方法訓(xùn)練得到;通過所述等價(jià)性判斷模型對(duì)所述語句進(jìn)行等價(jià)性判斷,得到等價(jià)性判斷結(jié)果。通過本申請(qǐng)實(shí)施例,可以提高語句等價(jià)性判斷的效率和精確性。
技術(shù)領(lǐng)域
本申請(qǐng)涉及機(jī)器學(xué)習(xí)、人工智能、自然語言處理技術(shù)領(lǐng)域,尤其涉及一種語句等價(jià)性判斷方法和裝置。
背景技術(shù)
隨著人工智能技術(shù)的興起,各個(gè)領(lǐng)域都從中受益,其中就包括備受業(yè)界關(guān)注的“問答機(jī)器人”領(lǐng)域。從最初基于“規(guī)則”的智能體到后來基于“知識(shí)圖譜”的智能體,問答機(jī)器人的性能得到了較大改善,但由于自然語言表述的復(fù)雜性及多樣性,如同義句的不同語言表達(dá)結(jié)構(gòu)和異義句的相似語言表達(dá)結(jié)構(gòu),容易迷惑機(jī)器人,使其在理解問題時(shí)就會(huì)產(chǎn)生極大的偏差,進(jìn)一步產(chǎn)生誤差傳遞嚴(yán)重限制其性能提升。
目前對(duì)于句子等價(jià)性的研究,主要是基于深度學(xué)習(xí)方法,例如基于Siamese 框架的方法和匹配聚合框架的方法。在基于Siamese框架的方法中,對(duì)兩個(gè)句子分別運(yùn)用相同的神經(jīng)網(wǎng)絡(luò)編碼器,使得句子被編碼到相同的句子向量空間中,然后僅基于兩個(gè)句子向量做出匹配決策。該框架的優(yōu)點(diǎn)是共享參數(shù)使得模型小且容易訓(xùn)練,缺點(diǎn)是在編碼過程期間兩個(gè)句子之間沒有明確的交互,導(dǎo)致可能丟失一些重要信息。在基于匹配聚合框架的方法中,匹配兩個(gè)句子的較小單元(如單詞或者上下文向量),然后將匹配結(jié)果聚合到向量中以做出最終決定。該框架可以捕獲兩個(gè)句子之間的更多交互的信息,但是模型的學(xué)習(xí)效率不夠高,并且忽略了深層次的匹配,缺少雙向匹配甚至任意距離的匹配。
因此,現(xiàn)有語句等價(jià)性判斷方案存在效率低、精確性差的問題。
發(fā)明內(nèi)容
本申請(qǐng)實(shí)施例提供一種基于語句等價(jià)性判斷方法和裝置,以解決現(xiàn)有語句等價(jià)性判斷方案存在效率低、精確性差的問題。
為解決上述技術(shù)問題,本發(fā)明實(shí)施例是這樣實(shí)現(xiàn)的:
第一方面,本發(fā)明實(shí)施例提供了一種語句等價(jià)性判斷方法,包括:獲取待判斷等價(jià)性的語句;將所述語句輸入預(yù)先訓(xùn)練的等價(jià)性判斷模型,所述等價(jià)性判斷模型根據(jù)基于深度學(xué)習(xí)模型和人工特征模型的模型平均方法訓(xùn)練得到;通過所述等價(jià)性判斷模型對(duì)所述語句進(jìn)行等價(jià)性判斷,得到等價(jià)性判斷結(jié)果。
第二方面,本發(fā)明實(shí)施例提供了一種語句等價(jià)性判斷裝置,包括:獲取模塊,用于獲取待判斷等價(jià)性的語句;輸入模塊,用于將所述語句輸入預(yù)先訓(xùn)練的等價(jià)性判斷模型,所述等價(jià)性判斷模型根據(jù)基于深度學(xué)習(xí)模型和人工特征模型的模型平均方法訓(xùn)練得到;判斷模塊,用于通過所述等價(jià)性判斷模型對(duì)所述語句進(jìn)行等價(jià)性判斷,得到等價(jià)性判斷結(jié)果。
第三方面,本發(fā)明實(shí)施例提供了一種語句等價(jià)性判斷的設(shè)備,包括:存儲(chǔ)器、處理器及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被所述處理器執(zhí)行時(shí)實(shí)現(xiàn)如上述第一方面所述的語句等價(jià)性判斷方法的步驟。
第四方面,本發(fā)明實(shí)施例提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上述第一方面所述的語句等價(jià)性判斷方法的步驟。
在本發(fā)明實(shí)施例中,可以通過根據(jù)基于深度學(xué)習(xí)模型和人工特征模型的模型平均方法訓(xùn)練得到等價(jià)性判斷模型,進(jìn)行句子等價(jià)性判斷,基于在自然語言處理領(lǐng)域表現(xiàn)良好的深度學(xué)習(xí)模型與深度學(xué)習(xí)模型可以互補(bǔ)的人工特征模型相結(jié)合,再使用模型平均的方法,可以獲得擬合準(zhǔn)確性和性能更佳的語句等價(jià)性判斷模型,從而提高語句等價(jià)性判斷的效率和精確性。
附圖說明
為了更清楚地說明本申請(qǐng)實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本申請(qǐng)中記載的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京百分點(diǎn)科技集團(tuán)股份有限公司,未經(jīng)北京百分點(diǎn)科技集團(tuán)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910832807.4/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 基于聊天大數(shù)據(jù)知識(shí)庫的機(jī)器人對(duì)話控制方法和系統(tǒng)
- 基于大數(shù)據(jù)搜索的幽默型機(jī)器人對(duì)話控制方法和系統(tǒng)
- 基于對(duì)話知識(shí)庫的機(jī)器人對(duì)話控制方法和系統(tǒng)
- 一種自然語言語句評(píng)價(jià)方法及裝置
- 句子級(jí)雙語對(duì)齊方法及系統(tǒng)
- 一種獲取相似語句的方法、裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 一種翻譯模型結(jié)果重排序的方法及裝置
- 用于輸出信息的方法、裝置、設(shè)備以及存儲(chǔ)介質(zhì)
- 搜索推薦方法和裝置、服務(wù)器、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本識(shí)別方法、裝置、電子設(shè)備和可讀存儲(chǔ)介質(zhì)
- 一種結(jié)合依賴關(guān)系消除誤判的等價(jià)性驗(yàn)證方法
- 負(fù)載分擔(dān)方法及裝置
- 一種包分類規(guī)則的查找方法及裝置
- 對(duì)發(fā)現(xiàn)的和用戶定義的幾何關(guān)系進(jìn)行結(jié)合
- 實(shí)時(shí)Java虛擬機(jī)中基于等價(jià)類的對(duì)象內(nèi)存狀態(tài)的記錄跟蹤方法
- 帶寬加權(quán)的等價(jià)多路徑路由
- 一種出方向路由過濾ORF處理方法和裝置
- 一種功能等價(jià)體異構(gòu)度最大化調(diào)度方法及裝置
- 等價(jià)路徑管理方法、裝置、通信設(shè)備及存儲(chǔ)介質(zhì)
- 一種負(fù)載分擔(dān)方法、裝置、設(shè)備及機(jī)器可讀存儲(chǔ)介質(zhì)
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





