[發(fā)明專(zhuān)利]醫(yī)學(xué)文獻(xiàn)分類(lèi)模型訓(xùn)練方法、醫(yī)學(xué)文獻(xiàn)分類(lèi)方法及其裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201710358918.7 | 申請(qǐng)日: | 2017-05-19 |
| 公開(kāi)(公告)號(hào): | CN108959236B | 公開(kāi)(公告)日: | 2021-11-09 |
| 發(fā)明(設(shè)計(jì))人: | 張喜媛;曾剛;李林峰 | 申請(qǐng)(專(zhuān)利權(quán))人: | 百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司 |
| 主分類(lèi)號(hào): | G06F16/35 | 分類(lèi)號(hào): | G06F16/35;G06F40/284;G06K9/62 |
| 代理公司: | 北京志霖恒遠(yuǎn)知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11435 | 代理人: | 陳姍姍 |
| 地址: | 100085 北京市*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 醫(yī)學(xué) 文獻(xiàn) 分類(lèi) 模型 訓(xùn)練 方法 及其 裝置 | ||
本申請(qǐng)公開(kāi)了一種醫(yī)學(xué)文獻(xiàn)分類(lèi)模型訓(xùn)練方法、醫(yī)學(xué)文獻(xiàn)分類(lèi)方法及其裝置,該訓(xùn)練方法,包括:從樣本文獻(xiàn)中提取待標(biāo)注數(shù)據(jù);利用預(yù)先建立的分類(lèi)體系和標(biāo)注規(guī)則庫(kù),對(duì)待標(biāo)注數(shù)據(jù)進(jìn)行標(biāo)注,其中分類(lèi)體系和標(biāo)注規(guī)則庫(kù)基于用戶(hù)對(duì)醫(yī)學(xué)文獻(xiàn)的分類(lèi)需求而構(gòu)建,分類(lèi)體系包括至少兩個(gè)分類(lèi)維度,每個(gè)分類(lèi)維度包括至少兩個(gè)文獻(xiàn)類(lèi)別,每個(gè)文獻(xiàn)類(lèi)別具有相關(guān)聯(lián)的標(biāo)注規(guī)則;將標(biāo)注數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)對(duì)分類(lèi)模型進(jìn)行訓(xùn)練,得到醫(yī)學(xué)文獻(xiàn)分類(lèi)模型。根據(jù)本申請(qǐng)實(shí)施例提供的技術(shù)方案,通過(guò)對(duì)文獻(xiàn)進(jìn)行基于專(zhuān)業(yè)分類(lèi)體系和標(biāo)注規(guī)則的分類(lèi),能夠解決現(xiàn)有醫(yī)學(xué)文獻(xiàn)的分類(lèi)不夠細(xì)化和專(zhuān)業(yè)的問(wèn)題。
技術(shù)領(lǐng)域
本公開(kāi)一般涉及計(jì)算機(jī)技術(shù)領(lǐng)域,尤其涉及一種醫(yī)學(xué)文獻(xiàn)分類(lèi)模型訓(xùn)練方法、醫(yī)學(xué)文獻(xiàn)分類(lèi)方法及其裝置。
背景技術(shù)
目前市面上提供的在線文獻(xiàn)服務(wù)平臺(tái),與醫(yī)學(xué)相關(guān)的文獻(xiàn)服務(wù)較少且不夠?qū)I(yè)。例如以下幾個(gè)平臺(tái):
萬(wàn)方:對(duì)于醫(yī)學(xué)文獻(xiàn),萬(wàn)方從醫(yī)藥、衛(wèi)生方面對(duì)醫(yī)療相關(guān)的文獻(xiàn)進(jìn)行了粗粒度的劃分。
Pubmed:提供生物醫(yī)學(xué)方面的論文搜尋以及摘要,其核心主題為醫(yī)學(xué),PubMed的文獻(xiàn)不包括期刊論文的全文,可提供指向全文提供者(付費(fèi)或免費(fèi))的鏈接。
上述兩個(gè)平臺(tái)均未提供完備的醫(yī)學(xué)文獻(xiàn)的分類(lèi),且僅從一個(gè)維度進(jìn)行類(lèi)別劃分,使得醫(yī)生查找某一類(lèi)文獻(xiàn)時(shí),不能很好地滿足搜索需求。
發(fā)明內(nèi)容
鑒于現(xiàn)有技術(shù)中的上述缺陷或不足,期望提供一種準(zhǔn)確度高且能夠進(jìn)行多維度分類(lèi)的醫(yī)學(xué)文獻(xiàn)分類(lèi)模型訓(xùn)練方法、醫(yī)學(xué)文獻(xiàn)分類(lèi)方法及其裝置。
第一方面,本申請(qǐng)?zhí)峁┮环N醫(yī)學(xué)文獻(xiàn)分類(lèi)模型的訓(xùn)練方法,包括:
從樣本文獻(xiàn)中提取待標(biāo)注數(shù)據(jù);
利用預(yù)先建立的分類(lèi)體系和標(biāo)注規(guī)則庫(kù),對(duì)所述待標(biāo)注數(shù)據(jù)進(jìn)行標(biāo)注,其中所述分類(lèi)體系和標(biāo)注規(guī)則庫(kù)基于用戶(hù)對(duì)醫(yī)學(xué)文獻(xiàn)的分類(lèi)需求而構(gòu)建,所述分類(lèi)體系包括至少兩個(gè)分類(lèi)維度,每個(gè)分類(lèi)維度包括至少兩個(gè)文獻(xiàn)類(lèi)別,每個(gè)文獻(xiàn)類(lèi)別具有相關(guān)聯(lián)的標(biāo)注規(guī)則;
將標(biāo)注數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)對(duì)分類(lèi)模型進(jìn)行訓(xùn)練,得到醫(yī)學(xué)文獻(xiàn)分類(lèi)模型。
第二方面,本申請(qǐng)?zhí)峁┮环N醫(yī)學(xué)文獻(xiàn)分類(lèi)方法,包括:
從待分類(lèi)文獻(xiàn)中提取待分類(lèi)數(shù)據(jù);
利用根據(jù)本申請(qǐng)?zhí)峁┑母鲗?shí)施例的醫(yī)學(xué)文獻(xiàn)分類(lèi)模型的訓(xùn)練方法訓(xùn)練后的醫(yī)學(xué)文獻(xiàn)分類(lèi)模型對(duì)待分類(lèi)數(shù)據(jù)進(jìn)行分類(lèi)預(yù)測(cè),獲得對(duì)應(yīng)預(yù)測(cè)類(lèi)別和對(duì)應(yīng)預(yù)測(cè)概率;
將所述預(yù)測(cè)概率與設(shè)定閾值進(jìn)行比較,確定分類(lèi)結(jié)果。
第三方面,本申請(qǐng)?zhí)峁┮环N醫(yī)學(xué)文獻(xiàn)分類(lèi)模型的訓(xùn)練裝置,包括:
提取單元:配置用于從樣本文獻(xiàn)中提取待標(biāo)注數(shù)據(jù);
標(biāo)注單元:配置用于利用預(yù)先建立的分類(lèi)體系和標(biāo)注規(guī)則庫(kù),對(duì)所述待標(biāo)注數(shù)據(jù)進(jìn)行標(biāo)注,其中所述分類(lèi)體系和標(biāo)注規(guī)則庫(kù)基于用戶(hù)對(duì)醫(yī)學(xué)文獻(xiàn)的分類(lèi)需求而構(gòu)建,所述分類(lèi)體系包括至少兩個(gè)分類(lèi)維度,每個(gè)分類(lèi)維度包括至少兩個(gè)文獻(xiàn)類(lèi)別,每個(gè)文獻(xiàn)類(lèi)別具有相關(guān)聯(lián)的標(biāo)注規(guī)則;
訓(xùn)練單元:配置用于將標(biāo)注數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)對(duì)分類(lèi)模型進(jìn)行訓(xùn)練,得到醫(yī)學(xué)文獻(xiàn)分類(lèi)模型。
第四方面,本申請(qǐng)?zhí)峁┮环N醫(yī)學(xué)文獻(xiàn)分類(lèi)裝置,其特征在于,包括:
提取單元:配置用于從對(duì)待分類(lèi)文獻(xiàn)中提取待分類(lèi)數(shù)據(jù);
預(yù)測(cè)單元:配置用于利用本申請(qǐng)?zhí)峁┑母鲗?shí)施例的醫(yī)學(xué)文獻(xiàn)分類(lèi)模型的訓(xùn)練裝置訓(xùn)練后的醫(yī)學(xué)文獻(xiàn)分類(lèi)模型對(duì)待分類(lèi)數(shù)據(jù)進(jìn)行分類(lèi)預(yù)測(cè),獲得對(duì)應(yīng)預(yù)測(cè)類(lèi)別和對(duì)應(yīng)預(yù)測(cè)概率;
分類(lèi)單元:配置用于將所述預(yù)測(cè)概率與設(shè)定閾值進(jìn)行比較,確定分類(lèi)結(jié)果。
第五方面,本申請(qǐng)?zhí)峁┮环N設(shè)備,設(shè)備包括:
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司,未經(jīng)百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710358918.7/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 將醫(yī)學(xué)設(shè)備自動(dòng)整合到醫(yī)學(xué)設(shè)施網(wǎng)絡(luò)的方法和設(shè)備
- 醫(yī)學(xué)詢(xún)問(wèn)細(xì)化系統(tǒng)、方法、裝置及包括醫(yī)學(xué)詢(xún)問(wèn)系統(tǒng)的工作站
- 將醫(yī)學(xué)設(shè)備自動(dòng)整合到醫(yī)學(xué)設(shè)施網(wǎng)絡(luò)的方法和設(shè)備
- 基于人工智能的醫(yī)學(xué)影像分類(lèi)處理系統(tǒng)及方法
- 一種醫(yī)學(xué)圖像系統(tǒng)
- 醫(yī)學(xué)知識(shí)圖譜構(gòu)建方法及裝置、存儲(chǔ)介質(zhì)和電子設(shè)備
- 一種實(shí)現(xiàn)醫(yī)學(xué)編碼映射的方法、裝置及設(shè)備
- 醫(yī)學(xué)影像的分類(lèi)方法、醫(yī)學(xué)影像的檢索方法和裝置
- 一種醫(yī)學(xué)圖像處理方法、醫(yī)學(xué)圖像識(shí)別方法及裝置
- 醫(yī)學(xué)圖像標(biāo)記方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- PDF科技文獻(xiàn)管理系統(tǒng)及其方法
- 建立新舊文獻(xiàn)代替關(guān)系的方法及裝置
- 一種自動(dòng)標(biāo)注文獻(xiàn)作廢的方法和裝置
- 一種新型的中文科技文獻(xiàn)半自動(dòng)標(biāo)引方法
- 文獻(xiàn)歸一方法、文獻(xiàn)搜索方法及對(duì)應(yīng)裝置
- 文獻(xiàn)價(jià)值評(píng)估方法和裝置
- 一種基于引用次數(shù)的文獻(xiàn)推薦方法
- 一種多語(yǔ)種文獻(xiàn)分類(lèi)方法、裝置及存儲(chǔ)介質(zhì)
- 一種文獻(xiàn)標(biāo)簽的識(shí)別方法及裝置
- 一種基于文檔數(shù)據(jù)分析的在線文獻(xiàn)歸納和儲(chǔ)存系統(tǒng)
- 數(shù)據(jù)分類(lèi)的方法和裝置
- 一種圖像分類(lèi)方法及裝置
- 報(bào)文分類(lèi)方法及網(wǎng)絡(luò)設(shè)備
- 一種短文本多標(biāo)簽分類(lèi)方法及裝置
- 一種高正確率的自然語(yǔ)言分類(lèi)器系統(tǒng)
- 多分類(lèi)模型優(yōu)化方法、裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 一種回收部件的分類(lèi)回收箱和分類(lèi)驗(yàn)收裝置
- 一種回收部件的分類(lèi)回收箱和分類(lèi)驗(yàn)收裝置
- 一種基于神經(jīng)網(wǎng)絡(luò)的文本分類(lèi)方法和裝置
- 一種塑料大小分類(lèi)機(jī)





