[發明專利]面向微創醫療領域文本摘要生成方法及裝置在審
| 申請號: | 201711148374.8 | 申請日: | 2017-11-17 |
| 公開(公告)號: | CN107832300A | 公開(公告)日: | 2018-03-23 |
| 發明(設計)人: | 孫曉;曹馨月;丁帥;楊善林;傅強;張林 | 申請(專利權)人: | 合肥工業大學;合肥德銘電子有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06F17/30;G16H10/60 |
| 代理公司: | 北京路浩知識產權代理有限公司11002 | 代理人: | 王瑩,余罡 |
| 地址: | 230009 安*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 面向 醫療 領域 文本 摘要 生成 方法 裝置 | ||
1.一種面向微創醫療領域文本摘要生成方法,其特征在于,包括:
將病歷文本通過預設的模型進行向量轉換,得到所述文本的語義向量和語序向量,將所述語義向量以及所述語序向量進行求和平均運算,得到第一向量;
將所述第一向量輸入到編碼器中進行去重簡化處理,得到包含語義和語序的特征向量X;
將所述特征向量X輸入到解碼器中,根據特征向量X的每一個元素xi對應生成初始摘要向量Y中的各個元素yi,其中每一個元素yi+1均是根據元素yi以及元素xi所對應的正常概率hi來確定的;
將生成的初始摘要向量Y與預設的標準摘要集中的人工摘要向量Z進行比較,并在比較結果通過時將所述初始摘要向量Y作為所述病歷文本的摘要進行輸出。
2.根據權利要求1所述的方法,其特征在于,所述將病歷文本通過預設的模型進行向量轉換,得到所述文本的語義向量和語序向量,包括:
將病歷文本通過預設的word embedding模塊利用word2vec工具進行映射處理,得到維度低于預設維度的語義向量和語序向量。
3.根據權利要求1所述的方法,其特征在于,所述將所述第一向量輸入到編碼器中進行去重簡化處理,得到包含語義和語序的特征向量X,包括:
將所述第一向量通過經典的卷積層和兩層遞歸LSTM相結合的編碼器進行去重簡化處理,得到包含語義和語序的特征向量X。
4.根據權利要求1所述的方法,其特征在于,將所述特征向量X輸入到解碼器中,根據特征向量X的每一個元素xi對應生成初始摘要向量Y中的各個元素yi,包括:
將所述特征向量X={x1,x2,…,xM}輸入到解碼器中,基于下式獲得初始摘要向量Y:
yi+1=argmaxy'P(y'|{y1,y2,,...,yi,ci+1},X;θ)
其中,ci+1用于表示生成yi時所需考慮的上下文情況,且:
表示生成不同單詞時解碼器在不同輸入詞語上的注意力權值,且
θ用于表示需要學習的模型參數;
P=(Y|X;θ)用于表示條件概率。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于合肥工業大學;合肥德銘電子有限公司,未經合肥工業大學;合肥德銘電子有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711148374.8/1.html,轉載請聲明來源鉆瓜專利網。





