[發明專利]用于語義信息可視化和指示生命科學實體之間顯著關聯的時間信號推斷的系統、方法和計算機可讀介質在審
| 申請號: | 201780071846.6 | 申請日: | 2017-09-22 |
| 公開(公告)號: | CN109964224A | 公開(公告)日: | 2019-07-02 |
| 發明(設計)人: | 穆拉利·阿拉瓦穆丹;溫卡塔拉馬南·桑達拉賈;阿吉特·拉賈耶克哈蘭;普拉桑·葉琳娜;阿爾俊·普拉尼克;阿什文·穆拉利;威廉·吉普森;恩里克·加西亞-里維拉;卡西克·穆盧加多斯 | 申請(專利權)人: | 恩芙潤斯公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06N5/02;G16B50/00 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 王小衡;王天鵬 |
| 地址: | 美國馬*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語義實體 關聯 語義 語義關聯 計算機可讀介質 集合 語義信息 時間片 知識庫 生命科學 時間信號 可視化 時間段 嵌入 推斷 輸出 檢測 | ||
公開的系統、方法和計算機可讀介質可以檢測語義實體之間的關聯并生成實體之間的語義信息。例如,可以識別知識庫中存在于的語義實體和相關聯的語義集合。可以確定時間段并將其劃分成時間片。可以為每個時間片生成所識別的語義實體的詞嵌入;可以確定第一語義實體輸入和第二語義實體輸入之間的第一語義關聯強度;以及可以確定第一語義實體輸入和與語義集合相關聯的語義實體之間的第二語義關聯強度,所述語義集合與第二語義實體相關聯。可以基于第一和第二語義關聯強度來提供輸出。
相關申請
本申請根據35U.S.C.§119(e)要求2016年9月22日提交的題為“用于語義信息可視化的方法和系統”的第62/398,386號美國臨時專利申請和2017年6月2日提交的題為“用于指示生命科學實體之間顯著關聯的時間信號推斷的方法和系統”的第62/514,697號美國臨時專利申請的權益,其全部內容通過引用整體明確并入本文。
背景技術
技術領域
本公開的實施例涉及用于分析數據中潛在關系的系統、方法和計算機可讀介質。
不論數據是多維的還是實時的,數據可視化的復雜性——特別是利用與線性相反的二維和三維布局——都在迅速提升,這促進了對數據和潛在關系的理解。然而,這些可視化方法對于呈現其中信息是非結構化的且需要語義推理來提取結構化信息的數據源是不太有效的。
某些數據源包含豐富的非結構化和半結構化信息,通常在制藥行業不同組成部分的不同孤島中訪問。例如,轉化醫學和臨床開發團隊通常會訪問clinicaltrials.gov網站;藥物警戒研發科學家和進行市場調研的商業數據科學家等通常訪問聯邦不良事件報告系統(FAERS)。
目前,生成對用戶查詢的概要/摘要響應還面臨著許多挑戰,特別是當響應需要使用不同來源的結構化和非結構化信息進行語義合成時。例如,在當前系統中,嘗試逐漸發展以超越僅對用戶查詢輸出匹配結果的“概要式響應”其實很簡單(例如,生成的響應中缺乏語義深度的單一來源的簡單概要),可以實現自動化(例如,針對諸如“nfl季后賽”或“2012年選舉”的查詢的實時分數或選舉狀態表)。
因此,需要一種高級可視化系統來呈現語義信息。
現有技術中的一些方法依賴于通過研究引用兩個實體的文檔(即實體對同現的文檔)隨時間的增長來識別實體對之間的開創性關聯。通常,此類方法的預測能力極小,尤其是當同現的文檔數量仍然很少時(即,關聯的相關知識處于初始階段)。從定義上來說,這些方法只能在公開的時候捕捉開創性關聯,而在公開之前則不能。引文索引等方法也需要長時間的監控才能進行重要的推斷。通過查看給定出版物的引文,在公開開創性關聯后,將會出現明顯的積極信號,但這一信號不能用于預測。
現有技術中的其他方法(例如,谷歌word2vec)沒有提供關于實體關聯的時間分析的深刻見解。此外,由于行業特定語言用法導致從非結構化源識別實體(例如藥物、基因、疾病)存在固有困難,因此,現有技術中用于自然語言處理(NLP)的通用方法在應用于任何特定行業(例如生命科學)時均存在許多缺點。
因此,需要一種高級系統來標記初期的和潛在的開創性關聯,并隨時間跟蹤其顯著性。
發明內容
根據所公開的主題,提供了用于語義信息可視化和指示生命科學實體之間顯著關聯的時間信號推斷的系統、方法和計算機可讀介質。
在詳細解釋根據本公開的示例性實施例之前,應當理解,本公開的應用不限于以下描述中闡述的或附圖中示出的構造細節和布置。本公開能夠具有除所描述的實施例之外的實施例,并且能夠以各種方式實踐和執行。此外,應當理解,本文以及摘要中使用的措辭和術語是為了描述,而不應被視為是限制性的。此外,雖然本公開中的討論集中于生命科學領域,但是公開的系統和方法的應用不限于這一領域。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于恩芙潤斯公司,未經恩芙潤斯公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201780071846.6/2.html,轉載請聲明來源鉆瓜專利網。





