[發(fā)明專利]一種實體識別規(guī)則庫的自動構建方法、系統(tǒng)及裝置在審
| 申請?zhí)枺?/td> | 202211328646.3 | 申請日: | 2022-10-27 |
| 公開(公告)號: | CN115630637A | 公開(公告)日: | 2023-01-20 |
| 發(fā)明(設計)人: | 林世琴;許磊超 | 申請(專利權)人: | 愷恩泰(南京)科技有限公司 |
| 主分類號: | G06F40/279 | 分類號: | G06F40/279;G16H15/00 |
| 代理公司: | 南京中擎科智知識產權代理事務所(普通合伙) 32549 | 代理人: | 黃智明 |
| 地址: | 211899 江蘇省南京市江北新*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 實體 識別 規(guī)則 自動 構建 方法 系統(tǒng) 裝置 | ||
1.一種實體識別規(guī)則庫的自動構建方法,其特征在于:包括如下步驟:
S1、獲取醫(yī)學病歷;
S2、從所述醫(yī)學病歷中抽取一定量的文本,構建數據集;
S3、根據預設庫選取預設數量的初代染色體,每個染色體包括一個正則表達式;
S4、對全部初代染色體進行遺傳操作;
S5、對經過S4處理的初代染色體進行校驗,得到滿足要求的染色體和不滿足要求的染色體,對于滿足要求的染色體,將其作為下一代染色體,同時對其獎勵值進行賦值;對于不滿足要求的染色體,對其懲罰值進行賦值,并將其重新經過S4處理,最終使初代染色體全部轉變?yōu)橄乱淮旧w,每個下一代染色體的懲罰值依次累加后作為其最終的懲罰值;
S6、判斷下一代染色體的數量是否等于上一代染色體的數量,若是則轉向S8,否則轉向S7;
S7、補充缺失的染色體,轉向S8;
S8、利用下一代染色體對數據集進行迭代運算,得到每個下一代染色體對應的適應值;
S9、判斷下一代染色體中是否存在一個染色體的適應值滿足預設條件,若是則迭代終止并轉向S10,否則返回S4;
S10、將滿足預設條件的下一代染色體中的正則表達式作為目標正則表達式。
2.根據權利要求1所述的一種實體識別規(guī)則庫的自動構建方法,其特征在于:所述步驟S2包括如下步驟:
S21、采用隨機方式從所述醫(yī)學病歷中抽取一定量的文本;
S22、探查文本,評估所需實體所占文本的比例,確保每個文本中所需實體的個數及文本總量均大于預設值;
S23、標記本文中所需的實體及其類型;
S24、對經過標記的文本進行二維轉換,得到一列原文及對應的一列實體。
3.根據權利要求2所述的一種實體識別規(guī)則庫的自動構建方法,其特征在于:所述步驟S3包括如下步驟:
S31、從所述預設庫中選取一個染色體,然后通過復制方式得到其余染色體,并將所有染色體作為初代染色體,或者從所述預設庫中隨機選擇預設數量的染色體作為初代染色體;
S32、將每個染色體的懲罰值和獎勵值的初始值設為0。
4.根據權利要求3所述的一種實體識別規(guī)則庫的自動構建方法,其特征在于:所述步驟S4包括如下步驟:
S41、設定遺傳操作的類型及概率值,以及每種正則表達式支持的遺傳操作及其變異值域;
S42、根據上述設定的內容對全部初代染色體進行遺傳操作。
5.根據權利要求4所述的一種實體識別規(guī)則庫的自動構建方法,其特征在于:所述步驟S5包括如下步驟:
S51、對經過S4的初代染色體進行合法性校驗,若合法則滿足要求,并轉向S52,否則轉向S53,合法性校驗包括非閉合括號校驗、非法組合校驗和未轉移字符檢驗;
S52、將合法的染色體作為下一代染色體,并根據正則表達式的長度對其獎勵值進行賦值;
S53、判斷不合法的染色體是否能夠修正,若能夠修正則滿足要求,并轉向S54,否則轉向S55;
S54、將染色體進行修正,將其作為下一代染色體,并根據正則表達式的長度對其獎勵值進行賦值;
S55、根據校驗類型對不能夠修正的染色體的懲罰值進行賦值,轉向S4。
6.根據權利要求5所述的一種實體識別規(guī)則庫的自動構建方法,其特征在于:所述步驟S7包括:
從所述預設庫中選取缺少的染色體,或者從初代染色體中復制缺少的染色體。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于愷恩泰(南京)科技有限公司,未經愷恩泰(南京)科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211328646.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:AR眼鏡腿及其制備方法、AR設備
- 下一篇:一種智能電網用控制柜





