[發(fā)明專(zhuān)利]基于FM模型的醫(yī)學(xué)熱點(diǎn)的預(yù)測(cè)方法、裝置和計(jì)算機(jī)設(shè)備在審
| 申請(qǐng)?zhí)枺?/td> | 202010621766.7 | 申請(qǐng)日: | 2020-06-30 |
| 公開(kāi)(公告)號(hào): | CN111782821A | 公開(kāi)(公告)日: | 2020-10-16 |
| 發(fā)明(設(shè)計(jì))人: | 曹立宇 | 申請(qǐng)(專(zhuān)利權(quán))人: | 平安科技(深圳)有限公司 |
| 主分類(lèi)號(hào): | G06F16/36 | 分類(lèi)號(hào): | G06F16/36;G06F16/335;G06F16/9535;G06F40/295 |
| 代理公司: | 深圳市明日今典知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44343 | 代理人: | 王杰輝 |
| 地址: | 518000 廣東省深圳市福田區(qū)福*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 fm 模型 醫(yī)學(xué) 熱點(diǎn) 預(yù)測(cè) 方法 裝置 計(jì)算機(jī) 設(shè)備 | ||
本申請(qǐng)涉及人工智能領(lǐng)域,公開(kāi)了一種基于FM模型的醫(yī)學(xué)熱點(diǎn)的預(yù)測(cè)方法、裝置和計(jì)算機(jī)設(shè)備,其中方法首次將FM模型應(yīng)用到醫(yī)學(xué)領(lǐng)域的醫(yī)學(xué)研究熱點(diǎn)的預(yù)測(cè)領(lǐng)域,其適合處理稀疏的特征,并且能夠挖掘出特征與特征之間的組合關(guān)系。除此之外,基于FM模型的醫(yī)學(xué)熱點(diǎn)的預(yù)測(cè)方法相比于知識(shí)圖譜預(yù)測(cè)和SVD算法預(yù)測(cè),能夠增加構(gòu)造特征,特征的增加有利于模型取得更好的效果。本申請(qǐng)的方法針對(duì)醫(yī)學(xué)領(lǐng)域內(nèi)流行的研究關(guān)系進(jìn)行統(tǒng)計(jì)并基于FM模型對(duì)未來(lái)可能出現(xiàn)的研究熱點(diǎn)進(jìn)行預(yù)測(cè),能夠預(yù)測(cè)某個(gè)疾病未來(lái)最有可能被研究的實(shí)體。一方面便于醫(yī)生對(duì)目前研究?jī)?nèi)容的搜索,另一方面有助于給醫(yī)生提供潛在的研究熱點(diǎn)的信息。本申請(qǐng)還可以應(yīng)用于區(qū)塊鏈領(lǐng)域中,如將訓(xùn)練后的模型存儲(chǔ)到區(qū)塊鏈網(wǎng)絡(luò)中。
技術(shù)領(lǐng)域
本申請(qǐng)涉及到人工智能領(lǐng)域,特別是涉及到一種基于FM模型的醫(yī)學(xué)熱點(diǎn)的預(yù)測(cè)方法、裝置和計(jì)算機(jī)設(shè)備。
背景技術(shù)
醫(yī)學(xué)研究熱點(diǎn)預(yù)測(cè)方法是基于大量醫(yī)學(xué)文獻(xiàn)數(shù)據(jù),使用文本挖掘構(gòu)建知識(shí)圖譜和模型,并提供已有的研究關(guān)系,然后推斷出可能在未來(lái)出現(xiàn)的生物醫(yī)學(xué)概念之間的關(guān)系。對(duì)未來(lái)醫(yī)學(xué)研究熱點(diǎn)的預(yù)測(cè)是研究人員探索研究主題的寶貴資源。
但是,發(fā)明人發(fā)現(xiàn),如今醫(yī)學(xué)領(lǐng)域的文獻(xiàn)發(fā)表數(shù)量增長(zhǎng)快速,并且隨著文獻(xiàn)發(fā)表率的提高,研究人員很難與其相關(guān)的研究?jī)?nèi)容時(shí)刻保持同步,從而難以跟進(jìn)和挖掘新穎的研究?jī)?nèi)容。
現(xiàn)有的醫(yī)學(xué)研究熱點(diǎn)的預(yù)測(cè)方法有基于知識(shí)圖譜的方法,但是只利用了圖譜的局部信息,因此預(yù)測(cè)結(jié)果不夠精準(zhǔn)。還有基于SVD的算法,但是該方法可解釋性差,并且難以找到合適的超參數(shù),在實(shí)際應(yīng)用中有所局限。
發(fā)明內(nèi)容
本申請(qǐng)的主要目的為提供一種基于FM模型的醫(yī)學(xué)熱點(diǎn)的預(yù)測(cè)方法、裝置和計(jì)算機(jī)設(shè)備,旨在解決現(xiàn)有技術(shù)中預(yù)測(cè)精準(zhǔn)度低或者可解釋性差的技術(shù)問(wèn)題。
為了實(shí)現(xiàn)上述發(fā)明目的,本申請(qǐng)?zhí)岢鲆环N基于FM模型的醫(yī)學(xué)熱點(diǎn)的預(yù)測(cè)方法,包括:
獲取待預(yù)測(cè)的兩個(gè)醫(yī)學(xué)實(shí)體名稱(chēng);
依據(jù)兩個(gè)所述醫(yī)學(xué)實(shí)體名稱(chēng),以及預(yù)設(shè)的醫(yī)學(xué)研究熱點(diǎn)的預(yù)測(cè)模型的特征格式,編寫(xiě)適用于所述預(yù)測(cè)模型的預(yù)測(cè)特征,其中所述預(yù)測(cè)模型是基于FM模型訓(xùn)練得到的模型,其中,所述預(yù)設(shè)特征為稀疏向量,稀疏向量中對(duì)應(yīng)醫(yī)學(xué)實(shí)體名稱(chēng)的位置的值為1,其余為0;
將所述預(yù)測(cè)特征輸入到所述預(yù)測(cè)模型中進(jìn)行計(jì)算,得到預(yù)測(cè)概率值,其中,所述預(yù)測(cè)概率值用于表示兩個(gè)醫(yī)學(xué)實(shí)體名稱(chēng)之間的相關(guān)性,預(yù)測(cè)概率值越大,則表示兩個(gè)醫(yī)學(xué)實(shí)體名稱(chēng)之間的相關(guān)性越強(qiáng);
判斷所述預(yù)測(cè)概率值是否大于預(yù)設(shè)閾值;
若是,則判定兩個(gè)所述醫(yī)學(xué)實(shí)體名稱(chēng)聯(lián)合到一起是一個(gè)醫(yī)學(xué)研究熱點(diǎn)。
進(jìn)一步地,所述依據(jù)兩個(gè)所述醫(yī)學(xué)實(shí)體名稱(chēng),以及預(yù)設(shè)的醫(yī)學(xué)研究熱點(diǎn)的預(yù)測(cè)模型的特征格式,編寫(xiě)適用于所述預(yù)測(cè)模型的預(yù)測(cè)特征的步驟之前,包括:
獲取記載有醫(yī)學(xué)知識(shí)的文獻(xiàn)數(shù)據(jù);
在所述文獻(xiàn)數(shù)據(jù)中查找預(yù)設(shè)的醫(yī)學(xué)實(shí)體名稱(chēng),并將查找到的各醫(yī)學(xué)實(shí)體名稱(chēng)在文獻(xiàn)數(shù)據(jù)中存在預(yù)設(shè)關(guān)聯(lián)關(guān)系的提取出來(lái);
依據(jù)提取出的具有關(guān)聯(lián)關(guān)系的醫(yī)學(xué)實(shí)體名稱(chēng)和所述特征格式編寫(xiě)正樣本數(shù)據(jù);以及構(gòu)建與正樣本數(shù)據(jù)格式相同,且不存在關(guān)聯(lián)關(guān)系的醫(yī)學(xué)實(shí)體名稱(chēng)的負(fù)樣本數(shù)據(jù),其中,所述負(fù)樣本的構(gòu)建采用實(shí)體間隨機(jī)組合和采樣的方式構(gòu)造;
利用所述正樣本數(shù)據(jù)和負(fù)樣本數(shù)據(jù)訓(xùn)練所述基于FM模型的模型,得到用于輸出預(yù)測(cè)概率值的所述預(yù)測(cè)模型。
進(jìn)一步地,所述獲取記載有醫(yī)學(xué)知識(shí)的文獻(xiàn)數(shù)據(jù)的步驟,包括:
到互聯(lián)網(wǎng)中查找醫(yī)學(xué)論文網(wǎng)站;
若查找到,則獲取所述醫(yī)學(xué)論文網(wǎng)站的建立時(shí)間和被訪問(wèn)次數(shù);
計(jì)算所述建立時(shí)間與當(dāng)前時(shí)間之間的時(shí)間長(zhǎng)度;
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于平安科技(深圳)有限公司,未經(jīng)平安科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010621766.7/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 將醫(yī)學(xué)設(shè)備自動(dòng)整合到醫(yī)學(xué)設(shè)施網(wǎng)絡(luò)的方法和設(shè)備
- 醫(yī)學(xué)詢問(wèn)細(xì)化系統(tǒng)、方法、裝置及包括醫(yī)學(xué)詢問(wèn)系統(tǒng)的工作站
- 將醫(yī)學(xué)設(shè)備自動(dòng)整合到醫(yī)學(xué)設(shè)施網(wǎng)絡(luò)的方法和設(shè)備
- 基于人工智能的醫(yī)學(xué)影像分類(lèi)處理系統(tǒng)及方法
- 一種醫(yī)學(xué)圖像系統(tǒng)
- 醫(yī)學(xué)知識(shí)圖譜構(gòu)建方法及裝置、存儲(chǔ)介質(zhì)和電子設(shè)備
- 一種實(shí)現(xiàn)醫(yī)學(xué)編碼映射的方法、裝置及設(shè)備
- 醫(yī)學(xué)影像的分類(lèi)方法、醫(yī)學(xué)影像的檢索方法和裝置
- 一種醫(yī)學(xué)圖像處理方法、醫(yī)學(xué)圖像識(shí)別方法及裝置
- 醫(yī)學(xué)圖像標(biāo)記方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





