[發明專利]一種藥品申報文檔的智能歸檔方法和系統有效
| 申請號: | 202010445804.8 | 申請日: | 2020-05-25 |
| 公開(公告)號: | CN111352898B | 公開(公告)日: | 2020-09-08 |
| 發明(設計)人: | 唐裕輝;郝華;魏巍;包卿 | 申請(專利權)人: | 浙江明度智控科技有限公司 |
| 主分類號: | G06F16/11 | 分類號: | G06F16/11;G06F16/14;G06K9/00 |
| 代理公司: | 杭州合譜慧知識產權代理事務所(特殊普通合伙) 33290 | 代理人: | 張剛 |
| 地址: | 310000 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 藥品 申報 文檔 智能 歸檔 方法 系統 | ||
1.一種藥品申報文檔的智能歸檔方法,其特征在于,包括:
S1,識別歸檔所參照的標準規范文件,確定所述標準規范文件各目錄關鍵字,并打包形成規則庫;
S2,選擇歸檔所需至少一個規則庫,并對所選規則庫設置規則庫優先級;所述規則庫包括但不限于第一優先規則、第二優先規則和/或第三優先規則,其中所述第一優先規則被配置為優先將目錄樹的編號和/或標題制作成規則文件;所述第二優先規則被配置為優先通過提取模版文件內容或手工設置關鍵字制作成規則文件;所述第三優先規則被配置為根據文件后綴優先將實驗室數據和/或材料放置在預先規定目錄中,所述優先級被配置為各藥品申報文檔根據所述規則庫優先級進行依次匹配,對已完成匹配的藥品申報文檔不再匹配低優先級規則庫;
S3,獲取需編排的藥品申報文檔列表,識別文檔標題和文件內容,并進行文檔關鍵字提取;
S41,根據所選規則庫及其優先級,依次對各藥品申報文檔進行規則匹配;當將標題優先規則設置為最高優先級,將特定格式規則設置為中等優先級,將關鍵字規則設置為低等優先級,則在對各藥品申報文檔進行規則匹配時,優先匹配當前文件的標題是否和標題優先規則匹配,如找到匹配的規則就終止尋找,否則進入下一優先級的規則,比較后綴和特定格式的規則,最后根據目錄模塊的關鍵字去匹配關鍵字規則,其中標題優先規則通過系統自動將目錄樹的編號或者目錄樹的標題制作成規則文件,其中特定格式規則基于實驗室數據和材料通過文檔后綴進行識別分類和歸檔,其中關鍵字規則通過自動提取模版文件內容或者手工設置關鍵字制成;
S42,將已完成與歸檔目錄樹中目錄對應的藥品申報文檔進行文件移動,并在數據庫記錄中對該文件移動狀態進行標示,當一個藥品文檔經過一個或多個匹配規則匹配目錄樹中的多個子目錄,則對藥品文檔進行多份復制后將復制的多份文檔分別移動至相應目錄下。
2.根據權利要求1所述的智能歸檔方法,其特征在于:所述標準規范文件為人用藥品注冊技術要求國際協調標準ICH。
3.根據權利要求2所述的智能歸檔方法,其特征在于,所述步驟S1具體包括:
S11,導入并識別ICH的標準規范文件,生成文件歸檔目錄樹;
S12,對各目錄標題進行劃詞并獲取關鍵字,將關鍵字綁定至文件歸檔目錄樹;
S13,將所述文件歸檔目錄樹和其綁定的各關鍵字打包形成一規則庫。
4.根據權利要求3所述的智能歸檔方法,其特征在于,所述步驟S3具體包括:獲取需編排的藥品申報文檔列表,識別文檔標題和文件內容,通過TF-IDF算法獲取當前文檔的關鍵字。
5.一種藥品申報文檔智能歸檔系統,包括存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運行的計算機程序,其特征在于:所述處理器執行所述計算機程序時實現如權利要求1-4任一所述方法的步驟。
6.一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機程序,其特征在于:所述計算機程序被處理器執行時實現如權利要求1-4任一所述方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江明度智控科技有限公司,未經浙江明度智控科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010445804.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:詞向量構建方法、裝置、電子設備及存儲介質
- 下一篇:一種可移動觸控顯示屏





