[發明專利]確定文本中要素屬性沖突的方法、裝置、設備和介質在審
| 申請號: | 202011487640.1 | 申請日: | 2020-12-16 |
| 公開(公告)號: | CN112560434A | 公開(公告)日: | 2021-03-26 |
| 發明(設計)人: | 紀登林;徐偉建;羅雨;彭衛華;鄭宇宏;李陶 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F40/205 | 分類號: | G06F40/205;G06N3/08 |
| 代理公司: | 北京市漢坤律師事務所 11602 | 代理人: | 姜浩然;吳麗麗 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 確定 文本 要素 屬性 沖突 方法 裝置 設備 介質 | ||
1.一種利用神經網絡模型確定文本中要素屬性沖突的方法,包括:
獲取相關的第一文本和第二文本,所述第一文本和所述第二文本均包括目標要素和針對所述目標要素的同一屬性的相關描述;
提取所述第二文本所包括的一個或多個子文本;
將所述第一文本和所述一個或多個子文本中的至少一部分子文本輸入神經網絡模型,獲取所述神經網絡模型輸出的所述第一文本和所述至少一部分子文本中的每一個相應的預測結果,所述預測結果能夠表征所述第一文本和相應的子文本之間是否存在針對所述目標要素的屬性沖突;以及
基于所述至少一部分子文本相應的至少一個預測結果,確定所述第一文本和所述第二文本之間是否存在要素屬性沖突。
2.如權利要求1所述的方法,其中,所述預測結果包括屬性一致、屬性不一致、屬性無關。
3.如權利要求2所述的方法,其中,確定所述第一文本和所述第二文本之間是否存在要素屬性沖突:
響應于確定所述至少一部分子文本中的至少其中一個子文本相應的預測結果為屬性不一致,確定所述第一文本和所述第二文本之間存在要素屬性沖突。
4.如權利要求2所述的方法,其中,確定所述第一文本和所述第二文本之間是否存在要素屬性沖突:
響應于確定所述至少一部分子文本中的每一個子文本相應的預測結果均為屬性一致,確定所述第一文本和所述第二文本之間不存在要素屬性沖突。
5.如權利要求2所述的方法,其中,確定所述第一文本和所述第二文本之間是否存在要素屬性沖突:
針對所述至少一部分子文本,響應于確定中的至少其中一個子文本相應的預測結果為屬性一致,剩余的子文本相應的預測結果為屬性無關,確定所述第一文本和所述第二文本之間不存在要素屬性沖突。
6.如權利要求1所述的方法,其中,以句子為單位將所述第二文本切割為所述一個或多個子文本。
7.如權利要求1-6中任一項所述的方法,其中,所述第一文本和所述第二文本均為醫療病例文本,
其中,所述第一文本為主訴,所述第二文本為與所述主訴對應的現病史,
其中,所述醫療病例文本所包括的要素包括以下中的任意一個:
疾病、癥狀、檢查項目、檢查結果、手術和藥物,
其中,所述要素的屬性包括以下中的任意一個:
部位、時間、嚴重程度和等級。
8.一種用于確定文本中要素屬性沖突的神經網絡模型的訓練方法,包括:
獲取均包括目標要素的第一樣本文本和第二樣本文本,并標注所述第一樣本文本和所述第二樣本文本之間的與所述目標要素相關的真實屬性沖突類別,
將所述第一樣本文本和第二樣本文本輸入神經網絡模型,獲取所述神經網絡模型輸出的預測屬性沖突類別;
基于真實屬性沖突類別和預測屬性沖突類別,計算損失值;以及
基于所述損失值調整所述神經網絡模型的參數。
9.如權利要求8所述的訓練方法,其中,所述真實屬性沖突類別包括屬性一致、屬性不一致、屬性無關。
10.如權利要求9所述的訓練方法,還包括:
基于知識圖譜,構建屬性一致的第一樣本文本組,每一組樣本文本包括所述第一樣本文本和第二樣本文本;
基于所述第一樣本文本組,構建屬性不一致的第二樣本文本組;以及
基于所述第一樣本文本組,構建屬性無關的第三樣本文本組。
11.如權利要求10所述的訓練方法,其中,通過修改所述第二樣本文本的屬性內容來構建屬性不一致的第二樣本文本組,所述第二樣本文本的修改后的屬性內容和所述第一樣本文本的屬性內容的屬性類別相同。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011487640.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種可穿戴設備主板測試治具
- 下一篇:一種節能環保的計算機用顯卡散熱裝置





