[發明專利]佛經注解模型訓練方法、佛經注解生成方法及相關設備在審
| 申請號: | 202110285891.X | 申請日: | 2021-03-17 |
| 公開(公告)號: | CN113011141A | 公開(公告)日: | 2021-06-22 |
| 發明(設計)人: | 白宏熙;周星浩 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F40/169 | 分類號: | G06F40/169;G06F40/242;G06F40/284;G06F40/289;G06F40/295;G06N3/04;G06N3/08 |
| 代理公司: | 北京市京大律師事務所 11321 | 代理人: | 姚維 |
| 地址: | 518033 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 佛經 注解 模型 訓練 方法 生成 相關 設備 | ||
1.一種佛經注解模型訓練方法,其特征在于,所述佛經注解模型訓練方法包括:
獲取佛經原文和所述佛經原文的注解內容;
對所述佛經原文進行分詞處理,得到所述佛經原文的關鍵詞,并確定所述關鍵詞對應的注解內容,生成佛學字典;
接收命名實體識別請求,并根據所述命名實體識別請求對所述佛經原文進行識別,得到所述佛經原文的命名實體;
將所述佛經原文、所述佛經原文的命名實體和所述佛學詞典作為訓練樣本,輸入預置BERT模型進行學習,得到目標佛經注解模型。
2.根據權利要求1所述的佛經注解模型訓練方法,其特征在于,所述對所述佛經原文進行分詞處理,得到所述佛經原文的關鍵詞包括:
獲取所述佛經原文中的文本數據,并對所述文本數據進行分詞處理,得到多個候選詞;
對與所述文本數據具有相同語義的標題進行切分,得到多個字符;
將所述多個候選詞依次輸入預置關鍵詞提取模型,得到各個候選詞相對于各個字符的注意力權重,其中,所述注意力權重用于表征每個候選詞分別與各個字符的語義關聯程度;
從各個候選詞中選擇在所述標題中出現的目標候選詞;
根據所述目標候選詞相對于各個字符的注意力權重,確定提取閾值;
根據所述提取閾值,從所述各個候選詞中確定出所述佛經原文的關鍵詞。
3.根據權利要求1所述的佛經注解模型訓練方法,其特征在于,所述接收命名實體識別請求,并根據所述命名實體識別請求,對所述佛經原文進行識別,得到所述佛經原文的命名實體包括:
接收命名實體識別請求,根據所述命名實體識別請求,確定所述佛經原文中的待識別的目標語句,并調用預置命名實體識別模型,其中,所述命名實體識別模型至少包括詞編碼層、字編碼層、雙向長短期記憶網絡層和命名實體識別層;
將所述目標語句輸入至所述詞編碼層,得到所述目標語句中的每個詞分別對應的第一詞向量;
將所述目標語句輸入所述字編碼層,得到所述目標語句中的每個字分別對應的目標字向量;
將所述目標字向量依次輸入至所述雙向長短期記憶網絡層,得到所述目標語句中的每個詞分別對應的第二詞向量;
將所述第一詞向量和所述第二詞向量輸入至所述命名實體識別層,得到所述目標語句中的命名實體。
4.根據權利要求2或3所述的佛經注解模型訓練方法,其特征在于,所述將所述佛經原文、所述佛經原文的命名實體和所述佛學詞典作為訓練樣本,輸入預置BERT模型進行學習,得到目標佛經注解模型包括:
將所述佛經原文、所述佛經原文的命名實體和所述佛學詞典作為訓練樣本輸入預置BERT模型的文本深度神經網絡,并通過連續時間分類算法進行學習,得到所述文本深度神經網絡的網絡參數;
使用激活函數對所述網絡參數進行優化,得到目標網絡參數;
通過所述目標網絡參數對所述文本深度神經網絡的網絡參數進行更新,得到初始佛經注解模型;
采用批標準化算法,對所述初始佛經注解模型進行批標準化處理,得到目標佛經注解模型。
5.根據權利要求4所述的佛經注解模型訓練方法,其特征在于,在所述接收命名實體識別請求,并根據所述命名實體識別請求,對所述佛經原文進行識別,得到所述佛經原文的命名實體之前,還包括:
對語料樣本進行預處理,得到字符序列樣本,并對所述字符序列樣本標注命名實體標簽,得到訓練字符序列;
基于預設的第一雙向語言模型和第一自注意力機制模型分別對所述訓練字符序列進行預訓練,獲得所述訓練字符序列對應的字特征向量和字權重向量;
基于預設的第二雙向語言模型和第二自注意力機制模型分別對所述訓練字符序列進行預訓練,獲得所述訓練字符序列對應的詞特征向量和詞權重向量;
對所述訓練字符序列對應的字特征向量和字權重向量進行融合獲得所述訓練字符序列的第一上下文向量;
對所述訓練字符序列對應的詞特征向量和詞權重向量進行融合獲得所述訓練字符序列的第二上下文向量;
使用所述訓練字符序列的第一上下文向量和第二上下文向量對依次連接的雙向神經網絡和條件隨機場進行訓練,得到命名實體識別模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110285891.X/1.html,轉載請聲明來源鉆瓜專利網。





