[發明專利]藥品詞典的生成及藥品搜索方法及裝置有效
| 申請號: | 202110025121.1 | 申請日: | 2021-01-08 |
| 公開(公告)號: | CN112687403B | 公開(公告)日: | 2022-12-02 |
| 發明(設計)人: | 張敏 | 申請(專利權)人: | 拉扎斯網絡科技(上海)有限公司 |
| 主分類號: | G16H70/40 | 分類號: | G16H70/40;G06F16/245 |
| 代理公司: | 北京清源匯知識產權代理事務所(特殊普通合伙) 11644 | 代理人: | 劉瑞英;汪洋 |
| 地址: | 200333 上海*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 藥品 詞典 生成 搜索 方法 裝置 | ||
1.一種藥品詞典的生成方法,其特征在于,包括:
獲取待搜索藥品對象的藥品文本序列,生成所述藥品文本序列的子序列;
基于所述藥品文本序列和所述藥品文本序列的子序列生成候選藥品詞典,所述候選藥品詞典由詞條數據構成,所述詞條數據包括藥品文本序列和所述藥品文本序列的子序列;
根據所述候選藥品詞典以及預先采集的藥品語料數據,生成目標藥品詞典,包括:如果第二詞頻大于預設文本有效性判斷閾值,并且第一詞頻與所述第二詞頻之間的比值滿足預設詞條有效性判斷條件,則將所述詞條數據添加至所述目標藥品詞典,所述第一詞頻為詞條數據的子序列在所述藥品語料數據中的出現頻率和/或出現次數,所述第二詞頻為與所述子序列對應的藥品文本序列在所述藥品語料數據中的出現頻率和/或出現次數;所述目標藥品詞典用于從待搜索藥品對象中搜索目標藥品對象。
2.根據權利要求1所述的方法,其特征在于,所述生成所述藥品文本序列的子序列,包括:
基于所述藥品文本序列中的元素及所述元素的后接元素生成所述藥品文本序列的子序列。
3.根據權利要求2所述的方法,其特征在于,還包括:
確定用于生成所述子序列的步長;
將所述步長作為子序列的長度;
針對所述藥品文本序列中的元素,按照所述長度確定與所述元素右鄰的一個或多個元素,作為所述元素的后接元素。
4.根據權利要求1所述的方法,其特征在于,所述基于所述藥品文本序列和所述藥品文本序列的子序列生成候選藥品詞典,包括:
建立所述藥品文本序列和所述藥品文本序列的每個子序列之間的對應關系;
根據每個子序列以及與所述子序列對應的藥品文本序列生成詞條數據,使用所述詞條數據生成所述候選藥品詞典。
5.根據權利要求1所述的方法,其特征在于,所述獲取待搜索藥品對象的藥品文本序列,包括:
獲取所述待搜索藥品對象的說明信息和/或標注信息;
從所述說明信息和/或標注信息中提取通用藥品名,作為所述藥品文本序列。
7.根據權利要求6所述的方法,其特征在于,所述對與醫藥相關的指定專業網站進行定向信息采集,得到與藥品相關的信息采集數據,包括:
使用與醫藥相關的關鍵詞作為搜索內容,從所述指定專業網站對應的第一鏈接地址,獲取針對所述與醫藥相關的關鍵詞的搜索結果數據;
從所述搜索結果數據中解析出第二鏈接地址,獲取所述第二鏈接地址對應的頁面內容;
從所述第二鏈接地址對應的頁面內容中解析出與藥品相關的文本資源,作為所述與藥品相關的信息采集數據。
8.根據權利要求6所述的方法,其特征在于,所述對與醫藥相關的指定專業網站進行定向信息采集,得到與藥品相關的信息采集數據,包括:
獲取所述指定專業網站的首頁導航信息;
根據所述首頁導航信息獲取與醫藥相關的欄目和/或分類板塊的頁面內容;
從所述頁面內容中解析出與藥品相關的文本資源,作為所述與藥品相關的信息采集數據。
9.一種藥品搜索方法,其特征在于,包括:
獲取用戶的搜索信息;
使用所述搜索信息查詢預設藥品詞典,得到與所述搜索信息對應的藥品文本序列;
獲取與所述藥品文本序列對應的至少一個藥品對象的信息,作為針對所述搜索信息的藥品搜索結果;
其中,所述預設藥品詞典為權利要求1至8任一項所述的目標藥品詞典。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于拉扎斯網絡科技(上海)有限公司,未經拉扎斯網絡科技(上海)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110025121.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種汽車座椅頭枕
- 下一篇:一種照明裝置以及全息3D打印相片的照明方法





