[發(fā)明專利]信息抽取方法、裝置、設(shè)備及存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 202110944183.2 | 申請日: | 2021-08-17 |
| 公開(公告)號: | CN113657102B | 公開(公告)日: | 2023-05-30 |
| 發(fā)明(設(shè)計)人: | 施振輝;夏源;王春宇;代小亞;黃海峰;王磊;陸超 | 申請(專利權(quán))人: | 北京百度網(wǎng)訊科技有限公司 |
| 主分類號: | G06F40/279 | 分類號: | G06F40/279;G16H10/60;G16H15/00 |
| 代理公司: | 北京同立鈞成知識產(chǎn)權(quán)代理有限公司 11205 | 代理人: | 李哲;臧建明 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 信息 抽取 方法 裝置 設(shè)備 存儲 介質(zhì) | ||
1.一種信息抽取方法,包括:
在待處理的醫(yī)患對話文本中識別得到N個醫(yī)學(xué)實體和每個醫(yī)學(xué)實體的類型,所述醫(yī)患對話文本中包括多個語句,所述醫(yī)患對話文本是對醫(yī)患對話語音進(jìn)行轉(zhuǎn)換得到的,所述N為大于或等于1的整數(shù);
針對所述多個語句中的第一語句,將所述第一語句輸入意圖識別模型中,得到所述意圖識別模型的輸出結(jié)果,輸出結(jié)果中包括多個候選意圖對應(yīng)的概率;將最大概率對應(yīng)的候選意圖,確定為所述第一語句的對話意圖;或者,
獲取多個預(yù)設(shè)意圖對應(yīng)的匹配規(guī)則;分別利用每個預(yù)設(shè)意圖對應(yīng)的匹配規(guī)則對所述第一語句進(jìn)行匹配處理,得到所述第一語句與每個預(yù)設(shè)意圖的匹配度;將最大匹配度對應(yīng)的預(yù)設(shè)意圖,確定為所述第一語句的對話意圖,所述第一語句為所述多個語句中的任意一個語句;
若所述第一語句的對話意圖指示詢問第一屬性,則從第二語句中確定所述第一屬性的屬性值;所述第一屬性為在所述醫(yī)患對話文本中識別得到的M個屬性中的任意一個屬性,所述第二語句位于所述第一語句之后,且位于第三語句之前,所述第三語句為所述醫(yī)患對話文本中醫(yī)生表達(dá)的語句,或者,所述第三語句的對話意圖指示詢問第二屬性,所述M為大于或者等于1的整數(shù);
針對每個醫(yī)學(xué)實體,針對所述M個屬性中的每個屬性,將所述屬性的屬性值、所述醫(yī)學(xué)實體以及所述醫(yī)患對話文本輸入語義關(guān)聯(lián)識別模型,獲取所述語義關(guān)聯(lián)識別模型輸出的所述醫(yī)學(xué)實體與所述屬性值之間的關(guān)聯(lián)度;
根據(jù)所述醫(yī)學(xué)實體與所述M個屬性中的每個屬性的屬性值之間的關(guān)聯(lián)度,確定所述醫(yī)學(xué)實體對應(yīng)的屬性信息,所述屬性信息包括至少一個屬性和每個屬性的屬性值;
根據(jù)所述N個醫(yī)學(xué)實體、每個醫(yī)學(xué)實體的類型以及每個醫(yī)學(xué)實體對應(yīng)的屬性信息,生成所述醫(yī)患對話文本對應(yīng)的信息抽取結(jié)果,所述信息抽取結(jié)果中包括N個信息項,每個信息項包括:所述醫(yī)學(xué)實體、所述醫(yī)學(xué)實體的類型、所述醫(yī)學(xué)實體對應(yīng)的屬性信息。
2.根據(jù)權(quán)利要求1所述的方法,其中,所述根據(jù)所述醫(yī)學(xué)實體與所述M個屬性中的每個屬性的屬性值之間的關(guān)聯(lián)度,確定所述醫(yī)學(xué)實體對應(yīng)的屬性信息,包括:
根據(jù)所述關(guān)聯(lián)度,從所述M個屬性以及每個屬性的屬性值中,確定至少一個目標(biāo)屬性以及每個目標(biāo)屬性的屬性值,所述醫(yī)學(xué)實體與每個目標(biāo)屬性的屬性值之間的關(guān)聯(lián)度大于或等于預(yù)設(shè)閾值;
根據(jù)所述至少一個目標(biāo)屬性以及每個目標(biāo)屬性的屬性值,生成所述醫(yī)學(xué)實體對應(yīng)的屬性信息,所述醫(yī)學(xué)實體對應(yīng)的屬性信息包括:所述至少一個目標(biāo)屬性以及每個目標(biāo)屬性的屬性值。
3.根據(jù)權(quán)利要求1或2所述的方法,其中,所述在所述醫(yī)患對話文本中識別得到M個屬性和每個屬性的屬性值,包括:
對所述醫(yī)患對話文本進(jìn)行分詞處理,得到多個詞語;
利用預(yù)設(shè)的屬性識別規(guī)則對每個詞語進(jìn)行識別,得到所述M個屬性和每個屬性的屬性值。
4.根據(jù)權(quán)利要求1或2所述的方法,其中,所述在待處理的醫(yī)患對話文本中識別得到N個醫(yī)學(xué)實體和每個醫(yī)學(xué)實體的類型,包括:
對所述醫(yī)患對話文本進(jìn)行分詞處理,得到多個詞語;
對所述多個詞語進(jìn)行醫(yī)學(xué)實體識別處理,得到所述N個醫(yī)學(xué)實體和每個醫(yī)學(xué)實體的類型。
5.根據(jù)權(quán)利要求1或2所述的方法,根據(jù)所述N個醫(yī)學(xué)實體、每個醫(yī)學(xué)實體的類型以及每個醫(yī)學(xué)實體對應(yīng)的屬性信息,生成所述醫(yī)患對話文本對應(yīng)的信息抽取結(jié)果之前,還包括:
對所述N個醫(yī)學(xué)實體進(jìn)行歸一化處理;
對每個醫(yī)學(xué)實體對應(yīng)的屬性信息中的每個屬性的屬性值進(jìn)行歸一化處理。
6.根據(jù)權(quán)利要求1或2所述的方法,根據(jù)所述N個醫(yī)學(xué)實體、每個醫(yī)學(xué)實體的類型以及每個醫(yī)學(xué)實體對應(yīng)的屬性信息,生成所述醫(yī)患對話文本對應(yīng)的信息抽取結(jié)果之后,還包括:
顯示所述信息抽取結(jié)果;或者,
向預(yù)設(shè)設(shè)備發(fā)送所述信息抽取結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京百度網(wǎng)訊科技有限公司,未經(jīng)北京百度網(wǎng)訊科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110944183.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





