[發(fā)明專利]語句生成在審
| 申請?zhí)枺?/td> | 201910967589.5 | 申請日: | 2019-10-12 |
| 公開(公告)號: | CN111126024A | 公開(公告)日: | 2020-05-08 |
| 發(fā)明(設(shè)計)人: | 許娟;P.沙馬 | 申請(專利權(quán))人: | 西門子醫(yī)療有限公司 |
| 主分類號: | G06F40/186 | 分類號: | G06F40/186;G06F40/284;G06F40/247;G06F16/58;G16H15/00;G06N3/08 |
| 代理公司: | 中國專利代理(香港)有限公司 72001 | 代理人: | 陳曉;劉春元 |
| 地址: | 德國*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語句 生成 | ||
公開了用于為放射學(xué)報告生成自然語言語句的方法、裝置。所述方法包括:獲得一個或多個詞,所述一個或多個詞已經(jīng)基于對放射學(xué)圖像的圖像處理而被產(chǎn)生;通過使用計算機(jī)實(shí)現(xiàn)的文本分析過程來分析所述一個或多個詞,用于生成表示放射學(xué)圖像的自然語言語句;以及輸出自然語言語句。所述計算機(jī)實(shí)現(xiàn)的文本分析過程包括:對于所述一個或多個詞中的每一個并且通過使用經(jīng)修改的詞嵌入而確定表示詞的向量;以及基于所確定的一個或多個向量并且通過使用文本生成器模型來確定自然語言語句。
技術(shù)領(lǐng)域
本發(fā)明涉及語句生成,并且更具體地涉及通過使用計算機(jī)實(shí)現(xiàn)的文本分析過程的語句生成。
背景技術(shù)
醫(yī)學(xué)文本報告、例如放射學(xué)報告被使用在醫(yī)學(xué)領(lǐng)域中用以在醫(yī)學(xué)專業(yè)人士之間傳送信息。例如,患者的醫(yī)師可以建議患者進(jìn)行某種醫(yī)學(xué)成像,例如計算機(jī)斷層掃描血管造影術(shù)(CTA)。放射科技師然后實(shí)施對患者的醫(yī)學(xué)成像,并且放射科醫(yī)師然后讀取或解釋結(jié)果得到的圖像以產(chǎn)生他們的發(fā)現(xiàn)的基于文本的放射學(xué)報告,其典型地通過使用自然語言語句來被編寫。放射學(xué)報告然后被提供給咨詢醫(yī)師。咨詢醫(yī)師然后可以基于放射學(xué)報告而做出對患者的狀況的診斷。
已知的基于人工智能(AI)的圖像分析算法分析醫(yī)學(xué)圖像以檢測異常,檢測解剖實(shí)體,對器官尺寸進(jìn)行分割和量化,或?qū)惓7诸惓筛鞣N類型等等。為不同的特定任務(wù)訓(xùn)練不同的AI算法。給定AI算法的輸出一般包括:包括數(shù)值或類別變量的發(fā)現(xiàn)的經(jīng)結(jié)構(gòu)化且定量的表。
US9767557B1(西門子保健有限責(zé)任公司)公開了基于遞歸神經(jīng)網(wǎng)絡(luò)(RNN)長短期記憶(LSTM)的斑塊檢測AI算法,其可以被應(yīng)用到冠狀CT血管造影術(shù)圖像以檢測斑塊,并且輸出與圖像有關(guān)的分類結(jié)果。分類結(jié)果可以是多類標(biāo)簽,例如針對斑塊類型分類(例如鈣化的、非鈣化的、混合的),或連續(xù)的值,例如針對狹窄分級退化。
然而,對于咨詢醫(yī)師或信息的其他消費(fèi)者而言可以難以解釋AI算法的輸出。將AI圖像處理算法輸出轉(zhuǎn)換成自然語言語句將減輕該問題。
用于將放射學(xué)發(fā)現(xiàn)轉(zhuǎn)換成自然語言語句的已知方法是供放射科醫(yī)師使用聽寫系統(tǒng)中的預(yù)定義的宏,所述聽寫系統(tǒng)基于關(guān)鍵字而自動地將敘述性文本填充到報告中。這些宏是硬編碼的并且被單獨(dú)定義,從而需要大量手動努力來創(chuàng)建。所述宏此外不可適應(yīng)于可能不同于創(chuàng)建宏的時候所意圖的規(guī)則的情形,并且當(dāng)僅僅向它們提供部分信息的時候不能創(chuàng)建敘述性語句。
因此合期望的是提供一種用于根據(jù)從放射學(xué)圖像分析所獲得的數(shù)據(jù)來生成自然語言語句的高效、靈活并且可靠的方法。
發(fā)明內(nèi)容
根據(jù)本發(fā)明的第一方面,提供有一種用于為放射學(xué)報告生成自然語言語句的方法,所述方法包括:獲得一個或多個詞,所述一個或多個詞已經(jīng)基于對放射學(xué)圖像的圖像處理而被產(chǎn)生;通過使用計算機(jī)實(shí)現(xiàn)的文本分析過程來分析所述一個或多個詞,用于生成表示放射學(xué)圖像的自然語言語句;以及輸出自然語言語句;其中所述計算機(jī)實(shí)現(xiàn)的文本分析過程包括:對于所述一個或多個詞中的每一個并且通過使用詞嵌入而確定表示詞的向量;以及基于所確定的一個或多個向量并且通過使用文本生成器模型來確定自然語言語句;并且其中所述詞嵌入是已經(jīng)通過基于第一數(shù)據(jù)而修改第一詞嵌入所生成的詞嵌入,所述第一詞嵌入已經(jīng)基于第一語料庫和第二語料庫中之一而被生成,所述第一數(shù)據(jù)已經(jīng)基于所述第一語料庫和第二語料庫中的另一個而被生成,所述第一語料庫包括來自一個或多個放射學(xué)報告的文本,所述第二語料庫不同于第一語料庫并且包括明語文本。
可選地,第一數(shù)據(jù)包括第二詞嵌入,所述第二詞嵌入已經(jīng)基于第一和第二語料庫中的另一個而被生成,并且所述詞嵌入是已經(jīng)通過基于第二詞嵌入而修改第一詞嵌入所生成的詞嵌入。
可選地,詞嵌入是已經(jīng)通過如下而被生成的詞嵌入:對于針對給定詞的給定詞嵌入,連接(concatenate)針對給定詞的第一詞嵌入的向量與針對給定詞的第二詞嵌入的向量以產(chǎn)生針對給定詞的經(jīng)修改的向量。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西門子醫(yī)療有限公司,未經(jīng)西門子醫(yī)療有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910967589.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 基于聊天大數(shù)據(jù)知識庫的機(jī)器人對話控制方法和系統(tǒng)
- 基于大數(shù)據(jù)搜索的幽默型機(jī)器人對話控制方法和系統(tǒng)
- 基于對話知識庫的機(jī)器人對話控制方法和系統(tǒng)
- 一種自然語言語句評價方法及裝置
- 句子級雙語對齊方法及系統(tǒng)
- 一種獲取相似語句的方法、裝置、存儲介質(zhì)及電子設(shè)備
- 一種翻譯模型結(jié)果重排序的方法及裝置
- 用于輸出信息的方法、裝置、設(shè)備以及存儲介質(zhì)
- 搜索推薦方法和裝置、服務(wù)器、計算機(jī)可讀存儲介質(zhì)
- 文本識別方法、裝置、電子設(shè)備和可讀存儲介質(zhì)





