[發明專利]一種基于條件隨機場的縮略詞擴展解釋識別方法在審
| 申請號: | 201210404108.8 | 申請日: | 2012-10-23 |
| 公開(公告)號: | CN103778142A | 公開(公告)日: | 2014-05-07 |
| 發明(設計)人: | 劉杰;陳季夢;黃亞樓;劉天筆;王嫄 | 申請(專利權)人: | 南開大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 300071*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 條件 隨機 縮略 擴展 解釋 識別 方法 | ||
1.一種基于條件隨機場的縮略詞擴展解釋識別系統,其特征在于:將傳統的縮略詞與擴展解釋對的識別任務建模成一個序列標記任務,并采用條件隨機場(CRF,Conditional?Random?Fields)來識別縮略詞的擴展解釋。所述方法包括將縮略詞擴展解釋識別任務建模為序列識別問題,用NP標簽來標注一個序列文本,用“B”來表示擴展解釋的開始,“I”來表示擴展解釋中的其他詞,而其他不相干的詞則標記為“O”;所述利用CRF來識別縮略詞擴展解釋,學習從觀測文本序列的特征矩陣x=(x1,...,xn)到標注序列向量y=(y1,...,yn)的函數映射關系所述具有潛在稀疏特征學習能力的條件隨機場(SNCRF,Sparse?Neural?Conditional?Random?Fields)的方法,是為了解決現實中的特征稀疏問題。在CRF中引入一個神經網絡算子δ(xt;α),以便從稀疏的原始數據特征中學習到潛在的有效特征,從而學習如何更好地識別給定縮略詞的擴展解釋,如
2.根據權利要求1所述的基于條件隨機場的縮略詞擴展解釋識別系統,其特征在于將傳統的縮略詞與擴展解釋對的識別任務建模成一個序列標記任務。
所述對縮略詞的擴展解釋識別任務建模成序列標注任務,是指將從序列文本中識別出解釋某縮略詞的短語這一過程建模為從文本中抽取序列特征,為序列特征自動標注標簽。縮略詞的序列標注模型定義為,給定一個縮略詞q和一個包含序列單詞x=(x1,...,xn)的句子,從所有可能的序列標注中挑選出最有可能的序列標注y=(y1,...,yn)。所述序列識別標簽設計,用“B”來表示擴展解釋的開始,“I”來表示擴展解釋中的其他詞,而其他不相干的詞則標記為“O”。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南開大學,未經南開大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210404108.8/1.html,轉載請聲明來源鉆瓜專利網。





