[發明專利]數據處理方法和裝置、電子設備、計算機可讀介質有效
| 申請號: | 202110587370.X | 申請日: | 2021-05-27 |
| 公開(公告)號: | CN113326691B | 公開(公告)日: | 2023-07-28 |
| 發明(設計)人: | 周厚謙;章文俊;鐘輝強;黃強;徐思琪;劉晨暉 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F40/211 | 分類號: | G06F40/211;G06F40/295;G06N3/0442 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐;馬曉亞 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據處理 方法 裝置 電子設備 計算機 可讀 介質 | ||
本公開提供了一種數據處理方法和裝置,涉及人工智能技術領域,進一步涉及深度學習、自然語言處理等技術領域。具體實現方案為:接收文本數據;基于預設的觸發詞,對文本數據進行語句篩選,得到至少一個候選語句;對至少一個候選語句進行實體提取,得到候選實體;去除至少一個候選語句中所有無候選實體的候選語句,得到有效語句;基于有效語句和候選實體,得到被觸發語句。該實施方式提高了文本數據抽取的準確性。
技術領域
本公開涉及數據處理技術領域,具體涉及人工智能技術領域,進一步涉及深度學習、自然語言處理等技術領域,尤其涉及一種數據處理方法和裝置、電子設備、計算機可讀介質以及計算機程序產品。
背景技術
現有言論抽取方案主要基于規則引擎和實體、句法分析,規則引擎需要基于語言規則制定大量的規則模板,需要專家經驗指導,泛化性低;采用實體、句法分析提取子句作為言論,依賴于現有實體抽取和句法分析模型效果,然而現實文本句子形式復雜,通過句法分析提取的子句往往有缺失,準確性較低。
發明內容
提供了一種數據處理方法和裝置、電子設備、計算機可讀介質以及計算機程序產品。
根據第一方面,提供了一種數據處理方法,該方法包括:接收文本數據;基于預設的觸發詞,對文本數據進行語句篩選,得到至少一個候選語句;對至少一個候選語句進行實體提取,得到候選實體;去除至少一個候選語句中所有無候選實體的候選語句,得到有效語句;基于有效語句和候選實體,得到被觸發語句。
根據第二方面,提供了一種數據處理裝置,該裝置包括:接收單元,被配置成接收文本數據;篩選單元,被配置成基于預設的觸發詞,對文本數據進行語句篩選,得到至少一個候選語句;提取單元,被配置成對至少一個候選語句進行實體提取,得到候選實體;去除單元,被配置成去除至少一個候選語句中所有無候選實體的候選語句,得到有效語句;觸發單元,被配置成基于有效語句和候選實體,得到被觸發語句。
根據第三方面,提供了一種電子設備,該電子設備包括:至少一個處理器;以及與至少一個處理器通信連接的存儲器,其中,存儲器存儲有可被至少一個處理器執行的指令,指令被至少一個處理器執行,以使至少一個處理器能夠執行如第一方面任一實現方式描述的方法。
根據第四方面,提供了一種存儲有計算機指令的非瞬時計算機可讀存儲介質,計算機指令用于使計算機執行如第一方面任一實現方式描述的方法。
根據第五方面,提供了一種計算機程序產品,包括計算機程序,計算機程序在被處理器執行時實現如第一方面任一實現方式描述的方法。
本公開的實施例提供的數據處理方法和裝置,首先,接收文本數據;其次,基于預設的觸發詞,對文本數據進行語句篩選,得到至少一個候選語句;再次,對至少一個候選語句進行實體提取,得到候選實體;從次,去除至少一個候選語句中所有無候選實體的候選語句,得到有效語句;最后,基于有效語句和候選實體,得到被觸發語句。由此,采用預設的觸發詞篩選候選語句,提高了被觸發語句提取效率和準確性;進一步對候選語句進行實體提取以及無效候選語句的去除,保證了被觸發語句得到的可靠性。
應當理解,本部分所描述的內容并非旨在標識本公開的實施例的關鍵或重要特征,也不用于限制本公開的范圍。本公開的其它特征將通過以下的說明書而變得容易理解。
附圖說明
附圖用于更好地理解本方案,不構成對本公開的限定。其中:
圖1是根據本公開數據處理方法的一個實施例的流程圖;
圖2是根據本公開實施例中實體抽取模型的一種結構示意圖;
圖3是根據本公開實施例中得到被觸發語句的方法的流程圖;
圖4是根據本公開實施例中被觸發語句抽取模型的一種結構示意圖;
圖5是根據本公開數據處理裝置的實施例的結構示意圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110587370.X/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種半導體器件制備方法
- 下一篇:用于柵極綁定關斷的新穎標準單元架構





