[發明專利]基于條件隨機場的序列標注方法、裝置、設備及介質在審
| 申請號: | 202110341820.7 | 申請日: | 2021-03-30 |
| 公開(公告)號: | CN112949320A | 公開(公告)日: | 2021-06-11 |
| 發明(設計)人: | 孫超;王健宗;于鳳英;程寧 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/44;G06N3/04;G06N3/08 |
| 代理公司: | 深圳市精英專利事務所 44242 | 代理人: | 涂年影 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 條件 隨機 序列 標注 方法 裝置 設備 介質 | ||
本申請涉及自然語言處理技術領域,揭露一種基于條件隨機場的序列標注方法、裝置、設備及介質,其中方法包括通過獲取目標文本序列和標準樣本序列,并將目標文本序列轉換為初始向量序列,并將其輸入序列標注模型中進行語義提取,得到特征序列,將特征序列與標準樣本序列進行語義標注處理,計算轉移概率,得到第一標注序列和元素的標簽和轉移概率得分,再計算每個元素的標簽概率分布和將標簽進行分離,得到第二標注序列,通過求解第二標注序列中的最優求解路徑,從而生成目標標注序列。本申請還涉及區塊鏈技術,目標文本序列存儲于區塊鏈中。本申請通過利用元素的語義信息與標簽的語義信息進行序列標注,有利于提高少量樣本序列標注的準確性。
技術領域
本申請涉及自然語言處理領域,尤其涉及一種基于條件隨機場的序列標注方法、裝置、設備及介質。
背景技術
條件隨機場(Conditional Random Fields,CRF),是一種判別式概率模型,是一種機器學習模型,常用于文本詞性標注,分詞,以及命名實體識別,如自然語言文字。
目前,條件隨機場在人工智能的自然語言處理(Natural Language Processing,NLP)領域中,將訓練語料序列進行序列標注時,往往是通過訓練語料序列的元素本身的語義結合上下文信息進行標注。然后,在少量樣本信息中,例如客服對話等,其缺乏上下文的信息,無法準確的將上下文信息與序列語料序列本身語義進行結合,從而導致序列標注的準確性降低?,F亟需一種能夠提高少量樣本序列標注的準確性的方法。
發明內容
本申請實施例的目的在于提出一種基于條件隨機場的序列標注方法、裝置、設備及介質,以提高少量樣本序列標注的準確性。
為了解決上述技術問題,本申請實施例提供一種基于條件隨機場的序列標注方法,包括:
獲取目標文本序列和標準樣本序列,并將所述目標文本序列轉換為對應的初始向量序列,其中,所述初始向量序列包括句子向量、各個字的字向量和各個字的位置向量;
將所述初始向量序列輸入預設的序列標注模型中進行語義提取,得到特征序列,其中,所述特征序列包括每個元素的語義信息,所述元素包括所述目標文本序列中的每個字或句子;
將所述特征序列與所述標準樣本序列進行語義標注處理,并通過條件隨機場引入概率轉移矩陣,計算所述特征序列每個元素的轉移概率,得到第一標注序列和每個元素對應的標簽和轉移概率得分;
基于所述第一標注序列的每個所述元素的語義信息與標簽的語義信息,以獲取所述每個元素的標簽概率分布,并構建映射空間將所述標簽進行分離,得到第二標注序列,其中,所述第二標注序列包括每個所述元素的標簽概率得分和轉移概率得分;
通過維特比算法對所述第二標注序列進行維特比求解,以得到所述第二標注序列中的最優求解路徑,并根據所述最優求解路徑生成目標標注序列。
為了解決上述技術問題,本申請實施例提供一種基于條件隨機場的序列標注裝置,包括:
初始向量序列轉換模塊,用于獲取目標文本序列和標準樣本序列,并將所述目標文本序列轉換為對應的初始向量序列,其中,所述初始向量序列包括句子向量、各個字的字向量和各個字的位置向量;
語義信息提取模塊,用于將所述初始向量序列輸入預設的序列標注模型中進行語義提取,得到特征序列,其中,所述特征序列包括每個元素的語義信息,所述元素包括所述目標文本序列中的每個字或句子;
第一標注序列生成模塊,用于將所述特征序列與所述標準樣本序列進行語義標注處理,并通過條件隨機場引入概率轉移矩陣,計算所述特征序列每個元素的轉移概率,得到第一標注序列和每個元素對應的標簽和轉移概率得分;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110341820.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種同側引出極氙燈的自適應安裝結構
- 下一篇:一種助力懸掛的鍋具系統





