[發明專利]屬性召回模型訓練方法、裝置、電子設備以及存儲介質有效
| 申請號: | 201911395747.0 | 申請日: | 2019-12-30 |
| 公開(公告)號: | CN111159377B | 公開(公告)日: | 2023-06-30 |
| 發明(設計)人: | 辛雯;馬工利 | 申請(專利權)人: | 深圳追一科技有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F40/279;G06F40/30 |
| 代理公司: | 深圳市智圈知識產權代理事務所(普通合伙) 44351 | 代理人: | 苗燕 |
| 地址: | 518057 廣東省深圳市南山區粵海街道*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 屬性 召回 模型 訓練 方法 裝置 電子設備 以及 存儲 介質 | ||
本申請實施例公開一種屬性召回模型訓練方法、裝置、電子設備及存儲介質。本方法通過獲取訓練樣本數據;再將文本語句中的名詞實體替換為表征名詞實體的實體類別的替換符,并在文本語句的首端添加預設數量的指定替換符,得到文本替換后訓練樣本數據;再對替換后訓練樣本數據進行向量化處理,然后將得到的第一向量以及第二向量輸入到預設召回模型中,計算得到損失參數,并基于損失參數調整預設召回模型的參數,得到屬性召回模型。通過用文本語句中表征名詞實體的實體類別的替換符替換名詞實體的方式,引入了實體類別的語義特征,再在文本語句的首端添加指定替換符,強調了文本語句的語義屬性,使得訓練得到的召回模型更加準確的召回文本語句的屬性。
技術領域
本申請涉及人工智能技術領域,更具體地,涉及一種屬性召回模型訓練方法、裝置、電子設備以及存儲介質。
背景技術
問答系統?(Question?Answering?System,QA?System)是信息檢索系統的下一代范式,它能夠理解人類的自然語言并能夠通過準確、簡潔的自然語言回答用戶的問題,是人工智能重要的應用方向。基于知識圖譜(Knowledge?Graph,KG)的問答系統因其滿足了問答系統對高質量知識來源的需求,能夠有效利用到人類總結的知識,實現更深層次的問題理解以及高準確率的問題反饋,有著廣泛的應用場景,受到各大公司和研究機構的重視。在基于知識圖譜的問答領域中,正確的理解文本語句中的語義至關重要,其中最重要的兩個環節為提取文本語句中的關鍵信息以及關鍵信息之間的關系,除去已經被正確識別了的實體以及實體之間的關系,這些實體之間可能還有不同的隱含關系及隱含屬性。然而,現有的問答模型由于過于龐大導致運算速度慢,并不能準確的識別這些實體之間的隱含關系以及隱含屬性,且難以直接運用到工程項目上進行召回隱含屬性打分。
發明內容
鑒于上述問題,本申請提出了一種屬性召回模型訓練方法、裝置、電子設備以及存儲介質,以改善上述問題。
第一方面,本申請實施例提供了一種屬性召回模型訓練方法,所述方法包括:獲取訓練樣本數據,所述訓練樣本數據包括文本語句、所述文本語句的屬性以及所述屬性與所述文本語句之間的關聯參數;將所述文本語句中的名詞實體替換為表征所述名詞實體的實體類別的替換符,并在所述文本語句的首端添加預設數量的指定替換符,得到文本替換后訓練樣本數據;對所述替換后訓練樣本數據進行向量化處理,得到待處理向量,所述待處理向量包括與所述文本語句對應的第一向量以及與所述屬性對應的第二向量;將所述第一向量以及所述第二向量輸入到預設召回模型中,以用于觸發所述預設召回模型基于所述第一向量以及所述第二向量,計算得到損失參數,并基于所述損失參數調整所述預設召回模型的參數,得到屬性召回模型,所述屬性召回模型用于召回文本語句的屬性。
進一步的,所述獲取訓練樣本數據,包括:獲取文本語句數據集,所述文本語句數據集包括多個文本語句;獲取與所述多個文本語句對應的屬性;獲取所述多個文本語句與所述對應的屬性之間的關聯參數,所述關聯參數用于區分所述屬性是否為與對應的文本語句匹配的屬性;將所述文本語句、所述對應的屬性以及對應的所述關聯參數以三元組的形式進行關聯存儲,得到訓練樣本數據。
進一步的,所述方法還包括:獲取所述文本語句數據集所包括的名詞實體;獲取所述名詞實體的所屬實體類別。
進一步的,所述對所述訓練樣本數據進行向量化處理,得到待處理向量,包括:通過預先構建的數字字典對所述文本語句數據集進行映射處理;將映射處理的結果向量作為待處理向量,所述數字字典中存儲有預先定義的字和數字、以及字符和數字的對應關系。
進一步的,所述通過預先構建的數字字典對所述文本語句數據集進行映射處理之前,還包括:獲取每一文本語句的所述替換符的出現次數;按照所述替換符的排列順序依次替換與所述出現次數的數量對應的所述指定替換符。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳追一科技有限公司,未經深圳追一科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911395747.0/2.html,轉載請聲明來源鉆瓜專利網。





