[發明專利]一種基于條件隨機場的電信領域命名實體識別方法在審
| 申請號: | 201711096147.5 | 申請日: | 2017-11-09 |
| 公開(公告)號: | CN107832296A | 公開(公告)日: | 2018-03-23 |
| 發明(設計)人: | 章韻;張歌 | 申請(專利權)人: | 南京郵電大學 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27 |
| 代理公司: | 南京經緯專利商標代理有限公司32200 | 代理人: | 徐瑩 |
| 地址: | 210003 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 條件 隨機 電信 領域 命名 實體 識別 方法 | ||
1.一種基于條件隨機場的電信領域命名實體識別方法,其特征在于,包括以下步驟:
步驟1、將語料轉化為條件隨機場CRF模型的輸入格式并利用基于詞的標注模型對其進行標注;
步驟2、選擇上下文窗口大小及從候選特征集中選取特征以構建特征模版;
步驟3、定義條件隨機場CRF模型的特征模版,將經步驟1得到的語料以及步驟2所得特征模版輸入條件隨機場CRF模型,得到電信領域命名實體識別CRF模型,并利用電信領域命名實體識別CRF模型進行待識別電信文本中的電信領域命名實體識別獲得輸出標注結果;
步驟4、從步驟3所得輸出標注結果中還原識別出的電信領域命名實體。
2.根據權利要求1所述基于條件隨機場的電信領域命名實體識別方法,其特征在于:所述步驟1中采用BIEO標注模型進行標注。
3.根據權利要求1所述基于條件隨機場的電信領域命名實體識別方法,其特征在于:所述步驟1中進行標注包括特征值標注以及詞角色標注。
4.根據權利要求1所述基于條件隨機場的電信領域命名實體識別方法,其特征在于:所述步驟2中從候選特征集中選取特征,具體包括:
定義電信領域命名實體所具有特征的集合作為候選特征集;
從候選特征集中選擇確定最優特征集,及將最優特征集中的特征作為所選取的特征。
5.根據權利要求4所述基于條件隨機場的電信領域命名實體識別方法,其特征在于:所述步驟2中利用遞增式學習方法從候選特征集中選擇確定最優特征集。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京郵電大學,未經南京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711096147.5/1.html,轉載請聲明來源鉆瓜專利網。





