[發(fā)明專利]實體詞語的識別方法、裝置、存儲介質(zhì)及電子設(shè)備在審
| 申請?zhí)枺?/td> | 202210719414.4 | 申請日: | 2022-06-23 |
| 公開(公告)號: | CN115130476A | 公開(公告)日: | 2022-09-30 |
| 發(fā)明(設(shè)計)人: | 于翠楠;王飛 | 申請(專利權(quán))人: | 南京燧坤智能科技有限公司 |
| 主分類號: | G06F40/295 | 分類號: | G06F40/295;G06F40/30;G06F40/126 |
| 代理公司: | 北京康信知識產(chǎn)權(quán)代理有限責(zé)任公司 11240 | 代理人: | 董文倩 |
| 地址: | 210046 江蘇省南京市棲霞區(qū)仙林*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 實體 詞語 識別 方法 裝置 存儲 介質(zhì) 電子設(shè)備 | ||
本發(fā)明公開了一種實體詞語的識別方法、裝置、存儲介質(zhì)及電子設(shè)備。其中,該方法包括:獲取待識別語句;對待識別語句進行語義分割處理,得到所述待識別語句中多個候選實體詞語分別對應(yīng)的基礎(chǔ)釋義;基于待識別語句所在目標(biāo)文檔的文檔信息,確定得到多個候選實體詞語分別對應(yīng)的第一補充釋義集合;基于預(yù)先確定的詞典庫和網(wǎng)絡(luò)知識庫,確定得到多個候選實體詞語分別對應(yīng)的第二補充釋義集合;根據(jù)多個候選實體詞語分別對應(yīng)的基礎(chǔ)釋義、第一補充釋義集合和第二補充釋義集合,從多個候選實體詞語中選取出目標(biāo)實體詞語。本發(fā)明解決了相關(guān)技術(shù)中僅依靠語句的語義信息進行實體詞語識別的方法存在的實體詞語獲取不準(zhǔn)確的技術(shù)問題。
技術(shù)領(lǐng)域
本發(fā)明涉及智能識別技術(shù)領(lǐng)域,具體而言,涉及一種實體詞語的識別方法、裝置、存儲介質(zhì)及電子設(shè)備。
背景技術(shù)
現(xiàn)有技術(shù)中識別語句中的實體詞語,主要是通過識別當(dāng)前語句的語義信息,并基于語義信息確定出當(dāng)前語句中的實體詞語。但在實際應(yīng)用中,僅僅根據(jù)語句的語義信息確定得到的實體詞語,可能僅作為一個示例項出現(xiàn),并不一定代表該語句的核心內(nèi)容,進而造成語句中實體詞語的誤識別。
針對上述的相關(guān)技術(shù)中僅依靠語句的語義信息進行實體詞語的識別方法存在的實體詞語獲取不準(zhǔn)確問題,目前尚未提出有效的解決方案。
發(fā)明內(nèi)容
本發(fā)明實施例提供了一種實體詞語的識別方法、裝置、存儲介質(zhì)及電子設(shè)備,以至少解決相關(guān)技術(shù)中僅依靠語句的語義信息進行實體詞語識別的方法存在的實體詞語獲取不準(zhǔn)確的技術(shù)問題。
根據(jù)本發(fā)明實施例的一個方面,提供了一種實體詞語的識別方法,包括:獲取待識別語句;對上述待識別語句進行語義分割處理,得到上述待識別語句中多個候選實體詞語分別對應(yīng)的基礎(chǔ)釋義;基于上述待識別語句所在目標(biāo)文檔的文檔信息,確定得到上述多個候選實體詞語分別對應(yīng)的第一補充釋義集合;基于預(yù)先確定的詞典庫和網(wǎng)絡(luò)知識庫,確定得到上述多個候選實體詞語分別對應(yīng)的第二補充釋義集合;根據(jù)上述多個候選實體詞語分別對應(yīng)的上述基礎(chǔ)釋義、上述第一補充釋義集合和上述第二補充釋義集合,從上述多個候選實體詞語中選取出目標(biāo)實體詞語。
可選的,上述基于上述待識別語句所在目標(biāo)文檔的文檔信息,確定得到上述多個候選實體詞語分別對應(yīng)的第一補充釋義集合,包括:獲取上述目標(biāo)文檔中的文檔內(nèi)容簡介信息,其中,上述文檔內(nèi)容簡介信息至少包括:文檔標(biāo)題信息、文檔關(guān)鍵詞信息以及文檔摘要信息;采用文本語義編碼模型對上述文檔內(nèi)容簡介信息進行語義分割處理,得到上述目標(biāo)文檔對應(yīng)的主旨概括信息;將上述主旨概括信息作為上述第一補充釋義集合。
可選的,上述獲取上述文檔內(nèi)容簡介信息中的上述文檔關(guān)鍵詞信息,包括:獲取上述目標(biāo)文檔中的文檔正文內(nèi)容信息;采用詞頻-逆文檔頻次算法對上述文檔正文內(nèi)容信息中的所有詞語進行評分;根據(jù)評分結(jié)果確定得到上述目標(biāo)文檔對應(yīng)的上述文檔關(guān)鍵詞信息。
可選的,在確定上述多個候選實體詞語中存在指示代詞的情況下,上述方法還包括:獲取上述目標(biāo)文檔中第一目標(biāo)位置對應(yīng)的第一連續(xù)語句,以及目標(biāo)文檔中第二目標(biāo)位置對應(yīng)的第二連續(xù)語句;采用上述文本語義編碼模型對上述第一連續(xù)語句和上述第二連續(xù)語句進行語義分割處理,得到第一綜合語義信息;將上述第一綜合語義信息納入至上述第一補充釋義集合。
可選的,在確定上述多個候選實體詞語中存在縮略詞的情況下,上述方法還包括:獲取上述目標(biāo)文檔中包括上述縮略詞的目標(biāo)語句;采用上述文本語義編碼模型對上述目標(biāo)語句進行語義分割處理,得到第二綜合語義信息;將上述第二綜合語義信息納入至上述第一補充釋義集合。
可選的,上述方法還包括:獲取上述待識別語句的屬性信息;根據(jù)上述待識別語句的屬性信息確定得到上述待識別語句對應(yīng)的目標(biāo)格式的子標(biāo)題;將上述目標(biāo)格式的子標(biāo)題納入至上述第一補充釋義集合。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京燧坤智能科技有限公司,未經(jīng)南京燧坤智能科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210719414.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:跨進程通信方法、裝置、設(shè)備及存儲介質(zhì)
- 下一篇:保護殼





