[發明專利]一種基于集成卷積編碼的醫療問答語義聚類方法有效
| 申請號: | 201710723583.4 | 申請日: | 2017-08-22 |
| 公開(公告)號: | CN107516110B | 公開(公告)日: | 2020-02-18 |
| 發明(設計)人: | 余志文;戴丹 | 申請(專利權)人: | 華南理工大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 廣州市華學知識產權代理有限公司 44245 | 代理人: | 李斌 |
| 地址: | 510640 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 集成 卷積 編碼 醫療 問答 語義 方法 | ||
本發明公開了一種基于集成卷積編碼的醫療問答語義聚類方法,涉及機器學習領域,所述方法包括以下步驟:醫療咨詢平臺用戶問答語料采集,卷積核的選取,融合不同卷積核的特征表示,利用自編碼機獲取最終數據表征,進行醫療咨詢問答語義聚類。與傳統的深度學習方法相比:本方法用不同的卷積核來提取不同的特征,提取的特征更加充分和多樣化,并且使用不同的特征合并方法,將提取到的特征進行融合表示,因此本發明泛化能力強,語義聚類準確率高,基于該方法能夠更好地幫助用戶了解自身情況,并可輔助醫生進行疾病檢測,對搭建醫療的自動問答系統具有很大的應用價值。
技術領域
本發明涉及計算機人工智能領域,尤其是機器學習領域,具體涉及一種基于集成卷積編碼的醫療問答語義聚類方法。
背景技術
隨著互聯網的飛速發展,人們的生活方式逐漸進行了改變。經統計調查,當普通用戶身體發生不適的時候,有90%的人會到互聯網上搜索相關的信息。互聯網因此也正在改變醫療生態。在互聯網醫療中,在線疾病導診是很重要和關鍵的一步。從而使得在健康相關的醫療領域,出現了許多在線疾病問答網站。病人通過描述自己的遭遇、詳細病情、用藥和治療情況等來和醫生進行交流并獲取疾病相關的護理知識。在這些相關疾病問答中,包含了許多個例的疾病信息。若從這些醫療問答語料中獲取病人對相關疾病的表征,有助于發掘和了解大量的有用信息,可提供追溯性,可對病人進行疾病預測,且在醫療自動問答系統中更容易理解病人咨詢的問題,對構建智能醫療有著重要的意義。
醫療語料文本數據具有噪音、稀疏、高維、異構、不完備、系統性偏見等特性,且同樣的癥狀不同患者有不同的描述方式,傳統方法是通過專家來選取合適的特征模式,并用特殊的方式來進行表示,但這種方法對特征空間尺度的不充分監督定義,不宜泛化,也錯失了發現新的模式和特征的良機,這使得傳統方法很難進行表征和建模。無監督表征學習,通過自動識別數據中的模式和依存關系,試著克服監督式特征空間定義的局限性,學會一種簡潔又通用的表征,且知識的自動獲取使得在建立分類器或其他預測器時能更簡單提取有用信息。而近些年,深度學習在圖像識別、機器翻譯、智能問答等方面的應用越來越多,其本質是通過構建多個隱層的機器學習模型和海量的訓練數據來學習更精準的特征,更能夠刻畫數據的內在信息,對于分析非結構化、模式不明多變、跨領域的大數據具有顯著優勢,對這些信息知識有很好的表示。但在醫療領域,深度學習的相關技術應用的并不是很廣泛,也沒有很可靠的應用于醫療智能問答等方面的工作流程中。
目前,國內外的各國政府、各大醫療機構和研究機構在智慧醫療方面都投入了極大的人力、物力和財力進行研究。在國外,較早開展區域協同醫療相關研究的有美國、加拿大、英國和澳大利亞等國家。其中,具有代表的工作是Google對患者的電子病歷進行基于降噪自編碼機的表示學習來構建特征空間,從而對患者進行疾病預測并給出相關的健康指導。而國內有丁小洪[健康資源共享機制及問答推薦方法研究.西安電子科技大學,2011]在研究醫藥衛生元數據標準的基礎上,給出實現資源共享的步驟,包括資源標準化和數據集成。探討了一個以元數據為核心、“物理上分布,邏輯上統一”、基于SOA體系結構的醫療資源共享平臺,提出了層次式資源共享模型,并從五個不同視圖出發來分析這個共享平臺。劉芳等[面向醫療行業的智能問答系統研究與實現.微電子學與計算機,2012,11:95-98]為了實現醫療信息化中的疾病與診療的智能問答系統,提出一種基于人機交互的用戶自然語言問題的理解方法。李超[智能疾病導診及醫療問答方法研究與應用.大連理工大學,2016]利用大數據技術,在疾病導診和疾病知識自動問答中進行研究,利用卷積神經網絡模型,以及自然語言處理技術構造在線導診模型,在問診數據上進行轉換和特征構造,提供類人的、權威的、內容豐富的醫療知識。宮繼兵等[基于概率因子圖模型的醫療社會網絡用戶健康狀態檢測方法.計算機研究與發展,2013,50(6):1285-1296]提出一種新的基于時空概率因子圖模型(temporal-spatial factor graph model,TS-FGM)的網絡用戶健康狀態檢測和預測方法,系統闡述新形勢下在一個動態社會網絡中節點用戶健康狀態如何進行檢測和預測以及不同因素對用戶健康狀態影響到何種程度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南理工大學,未經華南理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710723583.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:非球面光學鏡片調節系統
- 下一篇:一種售賣機缺貨檢測方法及裝置





